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但 您 购买 的 电子 书 仅 供 您 个 人 使 用 ， 
未 经 授权 ， 不 得 进行 传播 。 

我 们 愿意 相信 读者 具有 这 样 的 良知 
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如 果 购 买 者 有 侵权 行为 ， 我 们 可 能 
对 该 用 户 实 施 包括 但 不 限于 关闭 该 
帐号 等 维权 措施 ， 并 可 能 追究 法 律 
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及 相关 程序 库 的 优秀 特性 ， 避 免 重 复 劳 动 ， 同 时 写 旨 
过 本 书 ， 你 会 明白 用 好 Python 需要 了 解 的 重要 特性 ， 从 Python 2 
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Python 高 手 对 本 书 的 评论 





“我 非常 非常 喜爱 本 书 ， 它 就 像 一 位 经 验 丰 富 的 导师 从 旁 解 释 各 种 小 技巧 一 样 。 我 在 工作 中 
学 会 了 PowerShell， 现 在 在 学 习 Python ， 并 且 了 解 了 很 多 很 棒 的 新 东西 。 在 学 习 的 过 程 中 ,每 当 
遇 到 困难 (通常 是 在 Flask 蓝图 上 遇 到 问题 或 觉得 代码 可 以 更 加 具有 Python 特色 )， 我 都 会 在 公 
司 内 部 的 Python 聊天 室 发 布 问 题 。 


“同事 们 给 出 的 答案 常常 让 我 惊讶 ， 其 中 经 常 含 有 字典 解析 式 、lambda、 生 成 器 这 些 技巧 。 
在 掌握 并 正确 实现 这 些 技巧 后 ， 我 总 是 惊叹 Python 的 强大 。 

“之 前 ， 我 是 一 名 迷茫 的 PowerShell 脚本 用 户 ; 而 现在 ， 这 本 书 让 我 能 正确 、 合 理 地 使 用 这 
些 常 用 日 具有 Python 特色 的 技巧 。 

“我 没有 计算 机 科学 学 位 , 因此 很 高 兴 能 有 人 用 文字 解释 那些 只 有 科班 出 身 的 人 才 懂 的 知识 。 
我 非常 喜欢 这 本 书 ， 并 且 订 阅 了 电子 邮件 ， 而 本 书 也 是 我 通过 电子 邮件 了 解 到 的 。” 








































































































一 一 Daniel Meyer， 特 斯 拉 DA 


“第 一 次 听 说 本 书 ， 是 因为 一 位 同事 想 用 书 中 的 字典 示例 来 考 我 。 我 当时 几乎 可 以 确定 最 终 
结果 是 一 个 更 小 、 更 简单 的 字典 ， 但 必须 承认 ， 结 果 还 是 出 乎 我 的 意料 。?) 

“他 通过 视频 向 我 展示 了 本 书 ， 并 翻 页 让 我 浏览 了 一 下 ， 我 当时 就 求知 欲 爆 棚 ， 想 要 阅读 更 
多 的 内 容 。 

“当天 下 午 我 就 购买 了 本 书 ， 并 读 完 了 其 中 对 Python 字典 创建 方式 的 解释 。 当 天 晚 些 时 候 ， 
和 另 一 位 同事 一 起 喝 咖 啡 时 ， 我 也 考 了 他 这 个 问题 。?) 

“他 基于 相同 的 原理 提出 了 另 一 个 问题 , 但 得 益 于 书 中 条 理 分 明 的 解释 , 我 不 用 再 猜 结果 了 ， 
而 是 给 出 了 正确 答案 。 这 说 明 本 书 在 讲解 方面 做 得 很 好 。)) 

“我 并 不 是 Python 新 手 ， 也 熟悉 书 中 介绍 的 一 些 概念 ， 但 我 不 得 不 说 本 书 的 每 一 章 都 让 我 受 
益 良 多 。 作 者 编写 了 一 本 好 书 , 并 非常 出 色 地 解释 了 这 些 技巧 背后 的 概念 。 我 一 定 会 向 朋友 和 同 
推荐 本 书 1” 
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一 一 Og Maciel，Red Hat 工程 师 


2 Python 高 手 对 本 书 的 评论 





“我 非常 喜欢 读 达 恩 的 这 本 书 。 他 用 清晰 的 示例 解释 了 Python 的 重要 方面 (例如 使 用 双胞胎 
猫 解 释 is 和 == o 


“ 书 中 除了 给 出 代码 示例 ， 还 解释 了 相关 的 实现 细节 。 更 重要 的 是 ， 本 书 可 以 让 你 编写 出 更 
好 的 Python 代码 ! 


“实际 上 , 本 书 让 我 最 近 养 成 了 一 些 新 的 Python 好 习惯 ,例如 使 用 自 定义 异常 和 抽象 基 类 ( 我 
在 搜索 “抽象 类 ”时 发 现 了 达 恩 的 博客 )。 这 些 新 知识 本 身 就 让 本 书 物 有 所 值 。 






































一 一 Bob Belderbos，Oracle 工程 师 、PyBites 联合 创始 人 


友 


从 我 第 一 次 接触 Python 这 门 编程 语言 到 现在 已 经 有 将 近 10 年 了 。 多 年 前 第 一 次 学 习 Python 
时 , 我 还 有 点 不 情愿 。 在 此 之 前 , 我 使 用 另 一 门 语言 编程 ,但 在 工作 中 突然 被 分 配 到 了 另 一 个 团 
队 ， 其 中 每 个 人 都 在 使 用 Python。 我 的 Python 之 旅 就 从 那里 开始 了 。 


第 一 次 接触 Python 时 ， 我 被 告知 Python 很 容易 ， 能 快速 上 手 。 当 我 向 同事 询问 学 习 Python 
的 资源 时 ， 他 们 只 会 给 我 Python 官方 文档 的 链接 。 刚 上 手 就 阅读 文档 会 让 人 一 头 雾 水 ， 我 就 这 
样 挣 扎 了 一 段 时 间 ， 之 后 才 慢 慢 适 应 。 直 到 问题 时 ， 我 通常 需要 在 Stack Overflow 上 寻找 答案 。 


由 于 之 前 使 用 过 另 一 门 编程 语言 , 我 没有 寻找 介绍 如 何 编程 或 者 什么 是 类 和 对 象 这 样 的 入 门 
资源 ， 而 是 一 直 在 寻找 能 够 介绍 Python 专 有 特性 的 资料 ， 并 尝试 了 解 用 Python 编程 与 使 用 其 他 
语言 有 何 区 别 。 


我 花 了 好 几 年 才 充 分 理解 了 这 门 语言 。 当 我 阅读 达 恩 的 这 本 书 时 就 在 想 , 要 是 在 当初 开始 学 
习 Python 时 能 有 这 样 一 本 书 该 有 多 好 。 


举例 来 说 ， 在 众多 独特 的 Python 特性 中 ， 首 先 让 我 感到 惊讶 的 是 列表 解析 式 。 正 如 达 恩 在 
书 中 提 到 的 那样 ， 从 编写 for 循环 的 方式 就 能 看 出 一 个 人 是 否 刚 从 其 他 语言 转 到 Python。 我 记 
得 在 刚 用 Python 编程 时 ， 最初 得 到 的 代码 审查 评论 中 有 一 条 就 是 :“ 为 什么 不 在 这 里 使 用 列表 解 
析 式 ? ” 达 恩 在 第 6 章 中 清楚 地 解释 了 这 个 概念 。 他 首先 介绍 了 如 何 用 具有 Python 特色 的 方式 
编写 循环 ， 之 后 介绍 了 迭代 顺和 生成 器 。 

在 2.5 节 中 , 达 恩 介绍 了 几 种 在 Python 中 格式 化 字符 串 的 方法 。 字 符 串 格式 化 无 视 了 “Python 
之 禅 "， 即 做 一 件 事 应 该 只 有 一 种 明确 的 方式 。 达 恩 介 绍 了 儿 种 不 同 的 处 理 方式 ， 其 中 包括 我 最 
喜欢 的 Python 新 增 功能 fstring。 除 此 之 外 ， 他 还 介绍 了 每 种 方法 的 优 缺 点 。 

第 8 章 是 本 书 的 另 一 个 亮点 ， 其 中 介绍 了 Python 编程 语言 之 外 的 内 容 ， 包 括 如 何 调试 程序 
和 管理 依赖 关系 ， 并 且 一 筑 了 Python 字 市 码 的 究竟 。 

我 很 荣幸 也 很 乐意 推荐 我 的 朋友 达 恩 ' 巴 德 尔 编写 的 这 本 书 。 

通过 以 CPython 核心 开发 人 员 的 身份 向 Python 做 贡献 ， 我 与 许多 社区 成 员 建 立 了 联系 。 在 
我 的 Python 之 旅 中 ,我 遇 到 了 不 少 导 师 、 志 同道 合 者 ， 并 结交 了 许多 新 朋友 。 这 些 经 历 提醒 我 ， 
















































































































































































2 一 :并 








Python 不 仅仅 是 一 门 编程 语言 ， 更 是 一 个 社区 。 


掌握 Python 编程 不 仅 要 掌握 该 语言 的 理论 方面 ， 到 








解 和 和 采 月 


日 社 区 使 用 的 惯例 和 最 佳 实践 同 








达 恩 的 书 会 帮助 你 完成 这 个 旅程 。 我 相信 读 完 本 书后 ， 你 在 编写 Python 程序 时 会 更 有 信心 。 


Mariatta Wijaya 


Python 核心 开发 人 员 (mariatta.ca ) 
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简 介 








1.1 什么 是 Python 技巧 


Python 技巧 : 一 小 段 可 以 作为 教学 工具 的 代码 。 一 个 Python 技巧 要 么 简要 介绍 了 
Python 的 一 个 知识 点 ， 要 么 作为 一 个 启发 性 的 示例 ， 让 你 自行 深入 挖 握 ， 从 而 在 大 脑 中 
形成 直观 的 理解 。 


最 初 ， 这 些 Python 技巧 来 自 于 我 某 一 周 在 Twitter 上 分 享 的 一 组 代码 截图 。 出 乎 意料 的 是 ， 
大 家 的 反响 非常 强烈 ， 一 连 好 几 天 不 停 地 分 享 和 转发 我 的 Python 技巧 。 


随后 ， 许 多 开发 人 员 问 我 有 没有 “完整 合集 "。 其 实 我 只 是 整理 了 一 部 分 涵盖 不 同 Python 主 
题 的 技巧 ， 并 没有 什么 大 的 计划 。 这 仅仅 是 一 个 有 趣 的 Twitter 小 实验 。 


但 从 这 些 询问 中 , 我 意识 到 之 前 发 布 的 示例 代码 完全 可 以 用 作 教 学 工具 。 因 此 , 我 整理 出 更 
多 的 Python 技巧 ， 并 用 电子 邮件 分 享 给 读者 。 让 我 吃惊 的 是 ， 几 天 之 内 就 有 数 百 位 Python 开发 
人 员 注 册 订 阅 。 


在 随后 的 几 周 里 , Python 开发 人 员 读 者 已 经 形成 了 稳定 的 客户 流 。 他们 感谢 我 让 曾经 困扰 过 
他 们 的 Python 知识 点 变 得 通俗 易 懂 。 收 到 这 些 反 馈 让 我 感觉 棒 极 了 。 我 以 为 这 些 Python 技巧 只 
不 过 是 一 些 代 码 截 图 ， 但 是 许多 开发 人 员 因 此 受益 腓 浅 。 


因此 ， 我 决定 在 这 个 Python 技巧 的 实验 上 倾注 更 多 努力 ， 将 其 扩展 为 包括 约 30 封 邮件 的 一 
个 系列 。 每 一 封 邮件 只 有 一 个 标题 和 一 幅 代 码 截图 , 但 我 很 快意 识 到 这 种 格式 有 缺陷 。 那 时 有 个 
视力 存在 障碍 的 Python 开发 人 员 很 失望 地 通过 邮件 告诉 我 ， 他 的 屏幕 阅读 器 无 法 读 出 这 些 以 图 
片 形式 发 送 的 Python 技巧 。 


显然 ， 我 需要 在 这 个 项 目 上 多 花 一 点 时 间 来 吸引 更 多 的 人 ， 同 时 让 更 多 的 读者 受益 。 因 此 ， 
我 用 纯 文 本 加 上 适当 的 HIML 语法 高 亮 , 重 新 创建 了 所 有 介绍 Python 技巧 的 邮件 。 新 版 的 Python 
技巧 稳定 发 布 了 一 阵子 。 我 从 收 到 的 反馈 得 知 开 发 人 员 很 开心 ,因为 他 们 终于 能 够 复制 和 粘贴 代 
码 来 自己 尝试 了 。 
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随 着 越 来 越 多 的 开发 人 员 订 阅 “Python 技巧 ”这 个 系列 的 电子 邮件 , 我 从 收 到 的 回复 和 问题 
中 发 现 了 一 个 问题 : 有 些 技巧 本 身 就 足以 作为 启发 性 的 示例 , 但 一 些 比较 复杂 的 示例 则 缺少 一 个 
讲述 者 来 引导 读者 ， 也 没有 介绍 一 些 有 助 于 进一步 理解 的 资料 。 

这 是 男 一 个 可 以 大 幅 改 进 的 地 方 。 当 初 我 创建 dbader.org 的 目标 就 是 帮助 Python 开发 人 员 
提升 自己 ,显然 现在 正好 有 一 个 机 会 让 我 更 加 接近 这 个 目标 。 

因此 ,我 决定 提取 出 之 前 电子 邮件 中 最 有 价值 的 那些 Python 技巧 , 在 此 基础 上 编写 一 本 书 : 
口 以 短小 且 易 于 理解 的 示例 介绍 Python 最 酷 的 方面 ; 
口 以 “自助 餐 ” 的 形式 介绍 一 些 优秀 的 Python 特性 ， 激 励 读 者 提升 自己 的 能 
口 手把手 地 引导 读者 更 加 深入 地 理解 Python 。 


我 写本 书 完全 是 出 于 对 Python 的 热爱 ， 同 时 它 也 是 一 个 巨大 的 实验 。 和 希望 你 能 够 喜欢 ， 并 
在 阅读 过 程 中 学 到 相关 的 Python 知识 。 


1.2 ”本 书 作 用 


本 书 的 目标 是 让 你 成 为 更 加 高 效 的 Python 开发 人 员 ， 且 知识 和 实践 能 力 都 获得 提升 。 你 可 
能 会 奇怪 : 阅读 本 书 为 什么 会 获得 这 种 能 力 上 的 提升 ? 


本 书 并 不 是 循序 渐进 的 Python 教程 ， 也 不 是 人 门 级 的 Python 课程 。 如 果 你 在 Python 方面 刚 
起 步 ， 靠 本 书 并 不 会 成 为 资深 Python 开发 人 员 。 虽 然 在 这 种 情况 下 阅读 本 书 依然 有 帮助 ， 但 你 
还 是 要 靠 其 他 材料 来 掌握 Python 的 基本 技能 。 

如 果 你 对 Python 已 经 有 了 一 定 的 了 解 ， 那么 就 能 充分 利用 本 书 ， 并 借 此 进入 下 一 个 阶段 。 


如 果 你 已 经 使 用 了 一 阵子 Python 并 准备 好 更 进一步 ， 或 是 想 对 已 掌握 的 知识 进行 归纳 总 结 ， 或 
是 想 让 代码 更 具 Python 特色 ， 那 么 本 书 同样 非常 有 用 。 


如 果 你 已 经 掌握 了 其 他 编程 语言 并 想 快 速 掌握 Python, 本 书 同样 大 有 帮助 。 从 本 书 中 , 你 会 
发 现 许多 实践 技巧 和 设计 模式 ， 能 让 你 成 为 更 高 效 、 更 专业 的 Python 程序 员 。 
















































































































































































1.3 如何 阅 读本 书 


阅读 本 书 最 好 的 方法 是 将 其 看 作 含有 各 种 强大 Python 特性 的 “自助 餐 ”。 书 中 的 每 个 Python 
技巧 都 是 独立 的 ， 所 以 你 完全 可 以 从 一 个 技巧 跳 到 另 一 个 感 兴趣 的 技巧 。 实 际 上 ,我 也 鼓励 你 这 
么 做 。 


当然 ， 你 也 可 以 按 顺 序 通读 本 书 ， 这 样 就 不 会 错过 书 中 的 任何 一 个 Python 技巧 。 
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有 些 技 巧 很 简单 、 容 易 理解 ， 读 一 遍 就 能 应 用 到 日 常 工作 中 。 不 过 有 些 技巧 需要 花 点 时 间 | 
钻研 。 


如 果 你 在 将 某 个 技巧 集成 到 自己 的 程序 中 时 遇 到 了 困难 ， 可 以 先 在 Python 解释 器 的 会 话 中 
尝试 。 

如 果 这 样 还 不 行 ， 欢 迎 随时 与 我 联系 。 这 样 我 不 仅 能 帮 到 你 ， 而 且 能 改进 本 书 的 讲解 方式 ， 
长 远 来 看 还 能 帮 到 所 有 阅读 本 书 的 Python 爱好 者 。 





Python 整洁 之 道 








2.1 用 断言 加 一 层 保险 


有 时 ， 真 正 有 用 的 语言 特性 得 到 的 关注 反而 不 多 ， 比 如 Python 内 置 的 assert 语句 就 没有 
受到 重视 。 

本 节 将 介绍 如 何在 Python 中 使 用 断言 。 你 将 学 习 用 断言 来 自动 检测 Python 程序 中 的 错误 ， 
让 程序 更 可 靠 且 更 易于 调试 。 

读 到 这 里 ， 你 可 能 想 知 道 什么 是 断言 ， 以 及 它 到 底 有 什么 好 处 。 下 面 就 来 一 一 揭晓 答案 。 

从 根本 上 来 说 , Python 的 断言 语句 是 一 种 调试 工具 , 用 来 测试 某 个 断言 条 件 。 如 果断 言 条 件 
为 真 ， 则 程序 将 继续 正常 执行 ;但 如 果 条 件 为 假 ， 则 会 引发 AssertionError 异常 并 显示 相关 
的 错误 消息 。 


























2.1.1 示例 : Python 中 的 断言 


下 面 举 一 个 断言 能 派 上 用 场 的 简单 例子 。 本 书 中 的 例子 会 尝试 结合 你 可 能 在 实际 工作 中 遇 到 
的 问题 。 


假设 你 需要 用 Python 构建 在 线 商 店 。 为 了 添加 打折 优惠 券 的 功能 ， 你 编写 了 下 面 这 个 


apply_discount 国 数 : 


























ge oieoumnsteroe eeu 
Tor ee Se mie (oo dela 性 
dSeene on ome Soro lu 
return price 


注意 到 assert 语句 了 吗 ? 这 条 语句 确保 在 任何 情况 下 ,通过 该 函数 计算 的 折 后 价 不 低 于 0， 
也 不 会 高 于 产品 原价 。 


来 看 看 调用 该 函数 能 和 否 正 确 计算 折 后 价 。 在 这 个 例子 中 ， 商 店 中 的 产品 用 普通 的 字典 表示 。 
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这 样 能 够 很 好 地 演示 断言 的 使 用 方法 ,当然 实际 的 应 用 程序 可 能 不 会 这 么 做 。 下 面 先 创建 一 个 示 
例 产 品 ， 即 一 双 价 格 为 149 美元 的 漂亮 鞋子 : 

Ss3> shoes, = nanc pancey Shoes', ‘price': 14900% 
顺便 说 一 下 ,这 里 使 用 整数 来 表示 以 分 为 单位 的 价格 ,以 此 来 避免 货币 的 舍 和 人 问题。 一 般 而 
言 ， 这 是 个 好 办 法 …… 好 吧 ， 有 点 扯 远 了 。 现在 如 果 为 这 双 鞋 打 七 五 折 ， 即 优惠 了 25%， 则 售 价 
变 为 111.75 美元 : 









































> ee ue (ee 0 sy 
TL 


嗯 ,还 不 错 。 接着 再 尝试 使 用 一 些 无 效 的 折扣 ， 比 如 200% 的 “折扣 ”会 让 商家 向 顾客 付 钱 : 


pl soune (snoes 20 
Tracebaek (most recent call last): 
EN ET 
So el eon (Moneyey wlo)) 
区 生生 Yoyo oN oe 
| 
AssertionError 


从 上 面 可 以 看 到 ， 当 尝 试 使 用 无 效 的 折扣 时 ， 程序 会 停止 并 触发 一 个 AssertionErroro 
发 生 这 种 情况 是 因为 200% 的 折扣 违反 了 在 apply_discount 函数 中 设置 的 断言 条 件 。 


从 异常 栈 跟踪 信息 中 还 能 得 知 断言 验证 失败 的 具体 位 置 。 如 果 你 ( 或 者 团队 中 的 另 一 个 开发 
人 员 ) 在 测试 在 线 商 店 时 直到 这 些 错 误 ， 那么 查看 异常 回溯 就 可 以 轻松 地 了 解 是 哪里 出 了 问题 。 


这 极 大 地 加 快 了 调试 工作 的 速度 ,并 且 长 远 看 来 , 程序 也 更 易于 维护 。 朋 友 们 ， 这 就 是 断言 
的 力量 。 


















































2.1.2 ”为 什么 不 用 普通 的 异常 来 处 理 
你 可 能 很 奇怪 为 什么 不 在 前 面 的 示例 中 使 用 if 语句 和 异常 。 


要 知道 ,断言 是 为 了 告诉 开发 人 员 程 序 中 发 生 了 不 可 恢复 的 错误 。 对 于 可 以 预料 的 错误 〈 如 
未 找到 相关 文件 )， 用户 可 以 予以 纠正 或 重 试 ， 断 言 并 不 是 为 此 而 生 的 。 

断言 用 于 程序 内 部 自 检 ， 如 声明 一 些 代 码 中 不 可 能 出 现 的 条 件 。 如 果 触 发 了 某 个 条 件 ， 即 意 
味 着 程序 中 存在 相应 的 bug。 


如 果 程 序 没 有 bug， 那 么 这 些 断 言 条 件 永远 不 会 触发 。 但 如 果 违 反 了 断言 条 件 ， 程 序 就 会 毅 


省 并 报告 断言 错误 ,告诉 开 发 人 员 究竟 违反 了 哪个 “不 可 能 ”的 情况 。 这 样 可 以 更 轻松 地 追踪 和 
修复 程序 中 的 bug。 我 喜欢 能 让 生活 变 轻 松 的 东西 ， 你 也 是 吧 


现在 请 记 住 , Python 的 断言 语句 是 一 种 调试 辅助 功能 , 不 是 用 来 处 理 运行 时 错误 的 机 制 。 使 
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用 断言 的 目的 是 让 开发 人 员 更 快速 地 找到 可 能 导致 bug 的 根本 原因 。 除 非 程序 中 存在 bug， 和 否则 
绝 不 应 抛 出 断言 错误 。 


下 面 先 详 细 了 解 一 下 断言 的 语法 ， 接 着 介绍 在 实际 工作 中 使 用 断言 时 常见 的 两 个 陷阱 。 








2.1.3 ”Python 的 断言 语法 


在 开始 使 用 Python 的 某 项 特性 之 前 ,最 好 先 研究 它 是 如 何 实现 的 .根据 Python 文档 , assert 
语句 的 语法 如 下 所 示 : ” 








assert stmt = "assert" expressionl |["," expression2] 
其 中 expression1 是 需要 测试 的 条 件 ， 可 选 的 expression2 是 错误 消息 ， 如 果断 言 失败 则 显 
示 该 消息 。 在 执行 时 ，Python 解释 器 将 每 条 断言 语句 大 致 转换 为 以 下 这 些 语句 : 

El 


TE OE (On Ee ol 
raise AssertionError(expression2) 


这 上段 代码 有 两 个 有 趣 之 处 。 


第 一 , 代码 在 检查 断言 条 件 之 前 , 还 会 检查 ”debug_ 全 局 变量 ,这 是 一 个 内 置 的 布尔 标记 ， 
在 一 般 情况 下 为 真 ， 若 进行 代码 优化 则 为 假 。 下 一 节 将 进一步 讨论 。 

第 二 ， 还 可 以 使 用 expression2 传递 一 个 可 选 的 错误 消息 ， 该 消息 将 与 回溯 中 的 
AssertionError 一 起 显示 ， 用 来 进一步 简化 调试 。 例 如 ， 我 见 过 这 样 的 代码 : 


eee 






























































和 

) 

1 == 
) 


. else: 
assert False, (人 
'This should never happen, but it does ' 
UO on Wmen er tv nc tO 
raion vias coflbie WA ell eloc eke ae vo 
ne ule ne ee we nen) 


虽然 这 段 代 码 很 五 ,但 如 果 在 应 用 程序 中 直到 海 森 堡 bug”， 那 么 这 绝对 是 一 种 有 效 且 有 用 
的 技术 。 

















2.1.4 ”常见 陷阱 


在 Python 中 使 用 断言 时 ， 需 要 注意 两 点 : 第 一 ,断言 会 给 应 用 程序 带 来 安全 风险 和 bug; 第 











GD 详 见 Python 文档 : “The Assert Statement”。 
@ 指 在 尝试 研究 时 似乎 会 消失 或 者 改变 行为 的 bug， 参 见 维基 百科 “ 海 森 堡 bug” 词 条 。 
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二 ， 容 易 形 成 语法 怪 阁 ， 开 发 人 员 会 很 容易 编写 出 许多 无 用 的 断言 。 
这 些 问题 看 上 去 ( 而 且 可 能 确实 ) 相 当 严 重 , 所 以 你 应 该 至 少 对 以 下 两 个 注意 事项 有 所 了 解 。 
1. 注意 事项 1: 不 要 使 用 断言 验证 数据 


在 Python 中 使 用 断言 时 要 注意 的 一 个 重点 是 ， 若 在 命令 行 中 使 用 -o 和 -oo 标识， 或 修改 
CPython 中 的 PYTHONOPTIMIZE 环境 变量 ， 都 会 全 局 禁用 断言 。” 


此 时 所 有 断言 语句 都 无 效 ， 程 序 会 直接 略 过 而 不 处 理 断 言 ， 因 此 不 会 执行 任何 条 件 表达 式 。 
许多 其 他 的 编程 语言 也 有 类 似 的 设计 决策 。 因 此 使 用 断言 语句 来 快速 验证 输入 数据 非常 危险 。 


进一步 解释 一 下 , 如 果 程 序 使 用 断言 来 检查 一 个 函数 参数 是 否 包含 “错误 ”或 意 想 不 到 的 值 ， 
那么 很 快 就 会 发 现 事与愿违 并 会 导致 错误 或 安全 漏洞 。 

下 面 用 一 个 简单 的 例子 说 明 这 个 问题 。 与 前 面 一 样 ， 假 设 你 正在 用 Python 构建 一 个 在 线 商 
店 应 用 程序 ， 代 码 中 有 一 个 函数 会 根据 用 户 的 请 求 来 删除 产品 。 


由 于 刚刚 学 习 了 断言 ， 因 此 你 可 能 会 急于 在 代码 中 使 用 ( 反正 我 会 这 么 做 )。 于 是 ， 你 写 下 
这 样 的 实现 : 














































































































def delete product (prod_ id, user): 
caseecne User so eo Vsoe oon 
ES 
store.get_product (prod_ id) .delete() 


仔细 看 这 个 delete_progduct 函数 ， 如 果 禁 用 断言 会 发 生 什么 ? 

这 个 仅 有 三 行 代 码 的 函数 示例 存在 两 个 严重 的 问题 ， 都 是 由 不 正确 地 使 用 断言 语句 引起 的 。 

(1) 使 用 断言 语句 检查 管理 员 权 限 很 危险 。 如 果 在 Python 解释 器 中 禁用 断言 ， 这 行 代码 则 会 
变 为 空 操作 ,不 会 执行 权限 检查 ,之 后 任何 用 户 都 可 以 删除 产品 。 这 可 能 会 引发 安全 问题 ,攻击 
者 可 能 会 借 此 摊 毁 或 严重 破坏 在 线 商 店 中 的 数据 。 这 太 糟 糕 了 ! 

(2) 禁用 断言 后 会 跳 过 has_product () 检 查 。 这 意味 着 可 以 使 用 无 效 的 产品 ID 调用 get_ 
proquct () ， 这 可 能 会 导致 更 严重 的 bug， 具体 情况 取决 于 程序 的 编写 方式 。 在 最 糟 的 情况 下 ， 
有 人 可 能 借 此 对 商店 发 起 拒绝 服务 ( denial of service，DoS ) 攻击 。 人 例如， 如果 尝试 删除 未 知 产 
品 会 导致 商店 应 用 程序 崩溃 ， 那 么 攻击 者 就 可 以 发 送 大 量 无 效 的 删除 请 求 让 程序 无 法 工作 。 

那么 如 何 避 免 这 些 问 题 呢 ? 答案 是 绝对 不 要 使 用 断言 来 验证 数据 ， 而 是 使 用 常规 的 if 语句 
验证 ， 并 在 必要 时 触发 验证 异常 ， 如 下 所 示 : 




























































































人 详 见 Python 文档 :“Constants (debug _)”。 
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def delete product (product_id, user): 
J oe Vee Te cro 
Parse AEE Or (Ms ee admmeo eleesey 
Eo SON no el 
raise ValueError(' Unknown product id') 
store.get_product (product_id) .delete() 


修改 后 的 示例 还 有 一 个 好 处 ， 即 代码 不 会 触发 通用 的 AssertionError 异常 ， 而 是 触发 与 
语义 相关 的 异常 ， 如 ValueError 或 AuthError (后 者 需要 自行 定义 )。 

2. 注意 事项 2: 永 不 失败 的 断言 

开发 人 员 很 容易 就 会 添加 许多 总 是 为 真 的 Python 断言 ， 我 过 去 一 直 犯 这 样 的 错误 。 长 话 短 
说 ， 来 看 看 问题 所 在 。 

在 将 一 个 元 组 作为 assert 语句 中 的 第 一 个 参数 传递 时 ， 断 言 条 件 总 为 真 ， 因 此 永远 不 会 
失败 。 

例如 ， 这 个 断言 永远 不 会 失败 : 

el SS no une dronDilo Hei 

这 是 因为 在 Python 中 非 空 元 组 总 为 真 值 。 如 果 将 元 组 传递 给 assert 语句 ， 则 会 导致 断言 
条 件 始终 为 真 ， 因此 上 述 assert 语句 毫 无 用 处 ， 永远 不 会 触发 异常 。 

这 种 不 直观 的 行为 很 容易 导致 开发 人 员 写 出 糟糕 的 多 行 断 言 。 比 如 我 曾经 欢快 地 为 一 个 测试 
套件 写 了 一 扒 无 用 的 测试 用 例 ， 带 来 了 并 不 真实 的 安全 感 。 假 设 在 单元 测试 中 有 这 样 的 断言 : 

assert ( 


GO = 1 
no hnave eeeecm a ne reems. 

































































) 


第 一 次 检查 时 ,这 个 测试 用 例 看 起 来 非常 好 。 但 它 实际 上 永远 不 会 得 到 错误 的 结果 : 无 论 计 
数 费 变量 的 状态 如 何 ， 断 言 总 是 计算 为 True。 为 什么 会 这 样 ? 因为 其 中 只 是 声明 了 一 个 布尔 值 
总 是 为 真 的 元 组 对 象 。 

就 像 之 前 说 的 那样 ， 这 样 很 容易 就 会 搬 起 石头 砸 自己 的 脚 (我 的 脚 仍然 很 痛 )。 有 一 个 很 好 
的 对 策 能 防止 这 种 语法 巧合 导致 的 麻烦 ， 那 就 是 使 用 代码 linter 。 新 版 本 的 Python 3 也 会 对 这 些 
可 疑 断言 给 出 语法 警告 。 


顺便 说 一 下 , 这 也 是 为 什么 应 该 总 是 对 单元 测试 用 例 先 做 一 个 快速 的 冒 烟 测 试 。 要 确保 在 编 
写 下 一 个 测试 之 前 ， 当 前 测试 用 例 的 确 会 失败 。 



































QQ 我 写 了 一 篇 关于 在 Python 测试 中 避免 冒牌 断言 的 文章 ， 参 见 dbader.org/blog/catching-bogus-python-asserts。 
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2.1.5 ”Python 断言 总 结 


尽管 有 这 些 需要 注意 的 事项 ， 但 Python 的 断言 依然 是 功能 强大 的 调试 工具 ， 且 常常 得 不 到 
充分 的 利用 。 


了 解 断言 的 工作 方式 及 使 用 场景 有 助 于 编写 更 易 维 护 和 调试 的 Python 程序 。 

学 习 断 言 有 助 于 将 你 的 Python 知识 提升 到 新 的 水 平 ， 让 你 成 为 一 个 全 方位 的 Python 高 手 。 
我 确信 这 一 点 ， 因 为 断言 让 我 在 调试 过 程 中 节省 了 大 量 时 间 。 
2.1.6 ”关键 要 点 


口 Python 断言 语句 是 一 种 测试 某 个 条 件 的 调试 辅助 功能 ， 可 作为 程序 的 内 部 自 检 。 
口 断言 应 该 只 用 于 帮助 开发 人 员 识 别 bug， 它 不 是 用 于 处 理 运行 时 错误 的 机 制 。 
口 设置 解释 右 可 全 局 禁用 断 言 。 
























































2.2 ”巧妙 地 放置 逗号 

如 果 需 要 在 Python 中 的 列表 、 字 典 或 集合 常量 中 添加 或 移 除 项 ， 记 住 一 个 窍门 : 在 所 有 行 
后 面 都 添加 一 个 逗号 。 

还 不 太 明 白 ? 来 看 一 个 示例 。 假 设 在 代码 中 有 下 面 这 个 由 名 字 组 成 的 列表 : 

2 un le ee Bh lole 

在 修改 这 个 名 字 列 表 时 ， 通 过 git diff 查看 改动 可 能 有 点 不 方便 。 大 多 数 源 码 控制 系统 都 是 
基于 行 的 ， 因 此 无 法 标 出 同一 行 中 的 多 个 改动 。 

一 个 快速 改进 是 根据 编码 规范 ， 将 列表 、 字 典 或 集合 常量 分 割 成 多 行 ， 如 下 所 示 : 

>S5> niames = 川 

SAE 


WE oe 
"Bee 


















































eo 
这 样 每 项 独占 一 行 ， 因此 可 以 清楚 地 从 源码 控制 系统 的 di 芷 中 看 出 哪里 进行 了 添加 、 删 除 和 


修改 操作 。 虽 然 只 是 一 个 小 改动 , 但 我 发 现 这 有 助 于 避免 很 多 思春 的 错误 ， 也 让 团队 成 员 能 够 更 
方便 地 审阅 我 的 代码 改动 。 


但 现在 依然 有 两 个 编辑 情形 会 导致 混乱 ,， 即 在 列表 末尾 添加 或 移 除 内 容 时 ,还 需要 手动 调整 
逗号 来 保持 格式 的 一 致 性 。 


比如 需要 向 列表 中 添加 一 个 名 字 Jane, 则 需要 在 Dilbert 这 一 行 的 末尾 添加 一 个 逗号 来 避 





























10 第 2 章 Python 整洁 之 道 





免 一 个 讨厌 的 错误 ， 


TaNISSTEDI 

'Alice', 

Eu 

'Dilbert' ## <- 缺失 去 号 ! 
'Uane' 


这 
在 查看 这 个 列表 的 内 容 时 ， 请 做 好 心理 准备 : 


>>> names 
Ae eT Bo De ye 








可 以 看 到 ，Python 将 字符 串 Dilbert 和 Jane 合并 成 了 DilbertdJane。 这 称 为 字符 串 字 面 
值 拼 接 ， 是 文档 中 有 记录 的 刻意 行为 。 这 种 行为 可 能 会 在 程序 中 引入 令 人 难以 琢磨 的 bug: 


“以 空白 符 分 隔 多 个 相连 的 字符 事 或 byte 字面 值 ， 即 使 它们 各 自 使 用 不 同 的 引号 ， 
也 会 执行 拼接 操作 。”， 


在 某 些 情况 下 , 字符 串 字 面值 拼接 是 一 个 有 用 的 特性 。 例如， 在 跨越 多 行 的 长 字符 串 中 可 以 
省 去 反 斜 杠 : 











ny rl MO te de el A Dee ae Melia “edo nn 
SpEead ou CROSeml ee ec 
'And look, no backslash characters needed!') 


但 另 一 方面 ， 这 个 特性 有 时 又 会 成 为 负担 。 那 么 如 何 解决 这 个 问题 呢 ? 
在 Dilbert 后 添加 缺失 的 逗号 就 能 避免 两 个 字符 串 合 并 了 : 


> alinas Te ll 
'Alice', 
是 
I Te 
'Uane' 








] 


现在 回 到 原来 的 问题 。 为 了 向 列表 添加 一 个 新 名 字 ， 需 要 修改 两 行 代码 。 这 同样 让 开发 人 员 
很 难 从 git diff 看 出 到 底 做 了 什么 改动 : 到 底 是 添加 了 一 个 新 名 字 , 还 是 修改 了 Dilbert 这 个 名 字 ? 

幸运 的 是 Python 语法 留 有 余地 ， 让 我 们 可 以 一 劳 永 逸 地 解决 这 个 有 逗号 放置 问题 。 只 要 遵循 
一 种 能 够 避免 这 个 问题 的 编码 风格 即 可 ， 下 面 来 看 具体 方法 。 


在 Python 中 ， 可 以 在 列表 、 字 典 和 集合 常量 中 的 每 一 项 后 面 都 放置 一 个 逗号 ， 包 括 最 后 一 
项 。 因 此 只 要 记 住 在 每 一 行 末 尾 都 加 上 一 个 逗号 ， 就 可 以 避免 逗号 放置 问题 。 


















































GD 详 见 Python 文档 :“String literal concatenation”。 
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下 面 是 示例 的 最 终 版 : 


Se 

'Alice', 

Erelo 

SR Berenele yy, 
| 








看 到 Dilbert 后 面 的 那个 逗号 了 吗 ? 现在 能 方便 地 添加 或 移 除 新 的 项 , 无 须 再 修改 逗号 了 。 
这 不 仅 让 各 行 代码 保持 一 致 ， 而 且 源 码 控制 系统 生成 的 di 企 清 晰 整洁 ， 让 代码 审阅 者 心情 愉悦 。 
看 到 没 ， 有 时 魔法 就 藏 在 这 些 细微 之 处 。 


关键 要 点 








D 合理 的 格式 化 及 逗号 放置 能 让 列表 、 字 典 和 
D Python 的 字符 串 字面 值 拼接 特性 既 可 能 带 来 




















2.3 上下文 管理 器 和 with 语句 


有 人 认为 Python 的 with 语句 是 一 个 星 涩 的 特性 , 但 只 要 你 了 解 了 其 背后 的 原理 , 就 不 会 感 


到 神秘 了 。with 语句 实际 上 是 非常 有 用 的 特性 ， 有 助 于 编写 更 清晰 易 读 的 Python 代码 。 








with 语句 究竟 有 哪些 好 处 ? 它 有 助 于 简化 一 些 通用 资源 管理 模式 ， 抽 象 出 其 中 的 功能 ， 将 
其 分 解 并 重用 。 


若 想 充分 地 使 用 这 个 特性 ， 比 较 好 的 办 法 是 查看 Python 标准 库 中 的 示例 。 内 置 的 open () 函 
数 就 是 一 个 很 好 的 用 例 : 


Wb OS ele tte 
nt (OS 























打开 文件 时 一 般 建 议 使 用 with 语句 ， 因 为 这 样 能 确保 打开 的 文件 描述 符 在 程序 执行 离开 
with 语句 的 上 下 文 后 自动 关闭 。 本 质 上 来 说 ， 上 面 的 代码 示例 可 转换 成 下 面 这 样 : 





fe oO Snel ot 
这 

f.write('hello, world') 
‘Pinte 

f.closel() 


很 明显 ， 这 段 代码 比 with 语句 见长 。 注 意 ， 当 中 的 try. . .finally 语句 也 很 重要 ， 只 关 
注 其 中 的 逻辑 代码 还 不 够 : 
(ne lo es) 


es eniite A (eee OTDR 
telose() 
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如 果 在 调用 f.write() 时 发 生 异 常 ， 这 段 代 码 不 能 保证 文件 最 后 被 关闭 ， 因 此 程序 可 能 会 
泄露 文件 描述 符 。 此 时 with 语句 就 派 上 用 场 了 ， 它 能 够 简化 资源 的 获取 和 释放 。 


threading.Lock 类 是 Python 标准 库 中 另 一 个 比较 好 的 示例 , 它 有 效 地 使 用 了 with 语句: 


somemloer enreagdnon ioe 





# 有 问题 : 
some_lock.acquire() 
Ne 

# 执行 菜 些 操作 …… 
Tee 

Some lock.release'!) 


# 改进 版 : 
ae nl sons exeles 


# 执行 某 些 操 作 …… 
在 这 两 个 例子 中 , 使 用 with 语句 都 可 以 抽象 出 大 部 分 资源 处 理 逻 辑 。 不 必 每 次 都 显 式 地 写 
一 个 try.. .finally 语句 ，with 语句 会 自行 处 理 。 
with 语句 不 仅 让 处 理 系统 资源 的 代码 更 易 读 ， 而 且 由 于 绝对 不 会 忘记 清理 或 释放 资源 ， 
此 还 可 以 避免 bug 或 资源 泄漏 。 
2.3.1 在 自 定 义 对 象 中 支持 with 


无 论 是 open () 函数 和 threading .Lock 类 本 身 , 还 是 它们 与 with 语句 一 起 使 用 , 这 些 都 
没有 什么 特殊 之 处 。 只 要 实现 所 谓 的 上 下 文 管理 器 ( contextmanager )”, 就 可 以 在 自 定 义 的 类 和 
函数 中 获得 相同 的 功能 。 

上 下 文 管理 需 是 什么 ? 这 是 一 个 简单 的 “协议 ”( 或 接口 )， 自 定义 对 象 需要 遵循 这 个 接口 来 
支持 with 语句 。 总 的 来 说 ， 如 果 想 将 一 个 对 象 作为 上 下 文 管理 右 ， 需 要 做 的 就 是 向 其 中 添加 

enter 和 ”exit 方法 。Python 将 在 资源 管理 周期 的 适当 时 间 调 用 这 两 种 方法 。 


来 看 看 实际 代码 ， 下 面 是 open () 上 下 文 管理 天 的 一 个 简单 实现 : 

































































class ManagedFile: 
le En (Gn) 
self.name = name 


def __enter_ _(self): 
self.file = open(self.name, 'w') 
1 oe ee 


def Texie "(Self cxo tyoe cxolval cxcotor: 
ee es 
Se nl 





Oz 详 见 Python 文档 : “With Statement Context Managers”。 
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其 中 的 ManagedFile 类 遵循 上 下 文 管理 器 协议 ， 所 以 与 原来 的 open () 例子 一 样 ， 也 支持 with 
语句 : 
EM GESRINEE EN 人 王 E 区 世 划 和 二 于 全 


上 TO 
f.write('bye now') 








当 执 行 流程 进入 with 语句 上 下 文 时 ，Python 会 调用 enter。_ 获取 资源 ; 离开 with 上 下 
文 时 ，Python 会 调用 ”exit_ 释放 资源 。 


在 Python 中 ， 除 了 编写 基于 类 的 上 下 文 管理 器 来 支持 with 语句 以 外 ,标准 库 中 的 
context1lib? 模 块 在 上 下 文 管理 器 基本 协议 的 基础 上 提供 了 更 多 抽象 。 如 果 你 过 到 的 情形 正好 
能 用 到 context1lib 提供 的 功能 ， 那 么 可 以 节省 很 多 精力 。 


例如 , 使 用 context1lib.contextmanager 装饰 絮 能 够 为 资源 定义 一 个 基于 生成 右 的 工厂 
函数 ， 该 函数 将 自动 支持 with 语句 。 下 面 的 示例 用 这 种 技术 重 写 了 之 前 的 ManagedqFile 上 下 
文 管理 器 : 












































from contextlib import contextmanager 


@contextmanager 
def managed_ file (name): 
CE 
f = open(name, 'w') 
yield f 
1 人 ER 
colese 


S22 wllem mils eo ele nl cde uy ee 
te (lee 
f.write('bye now') 

















这 个 managea_file() 是 生成 器 ， 开 始 先 获取 资源 ， 之 后 暂停 执行 并 产生 资源 以 供 调 用 者 
使 用 。 当 调用 者 离开 with 上 下 文 时 ， 生 成 器 继续 执行 剩余 的 清理 步骤 ， 并 将 资源 释放 回 系统 。 


基于 类 的 实现 和 基于 生成 器 的 实现 基本 上 是 等 价 的 ， 选 择 哪 一 种 取决 于 你 的 编码 偏好 。 


基于 econtextmanaget 的 实现 有 一 个 缺点 ， 即 这 种 方式 需要 对 装饰 顺和 生成 器 等 Python 
高 级 概念 有 所 了 解 。 如 果 你 想 学 习 这 些 知 识 ， 可 阅读 本 书 中 的 相关 音节。 


再 次 提醒 ， 选 择 哪 种 实现 取决 于 你 自己 和 团队 中 其 他 人 的 编码 偏好 。 















































2.3.2 ”用 上 下 文 管理 器 编写 漂亮 的 API 
上 下 文 管理 器 非常 灵活 ， 巧 妙 地 使 用 with 语句 能 够 为 模块 和 类 定义 方便 的 API。 











| 详 见 Python 文档 : “contextlib”。 
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例如 ， 如 果 想 要 管理 的 “资源 ”是 某 种 报告 生成 程序 中 的 文本 缩 进 层次 ， 可 以 编写 下 面 这 样 
的 代码 : 


with Indenter() as indent: 
TEL) 
El eee 
neler 
Wa El. ol 
emer nu 
indent .print ('hey') 


这 些 语句 读 起 来 有 点 像 用 于 缩 进 文本 的 领域 特定 语言 (DSL )。 注 意 这 段 代码 多 次 进入 并 离 
开 相 同 的 文本 管理 器 ， 以 此 来 更 改 缩 进 级 别 。 运 行 这 段 代 码 会 在 命令 行 中 整齐 地 显示 出 下 面 的 
内 容 : 

Ha 


hello 
bonjour 























hey 
那么 如 何 实现 一 个 上 下 文 管理 器 来 支持 这 种 功能 呢 ? 


顺便 说 一 句 ， 这 是 一 个 不 错 的 练习 ， 从 中 可 以 准确 理解 上 下 文 管理 需 的 工作 方式 。 因 此 在 查 
看 下 面 的 实现 之 前 ， 最 好 先 花 一 些 时 间 尝 试 自行 实现 。 


如 果 你 已 经 准备 好 查看 我 的 实现 ， 那 么 下 面 就 是 使 用 基于 类 的 上 下 文 管理 器 来 实现 的 方法 : 














class Indenter: 
le (I 
self.level = 0 


def enter _(self): 
self.level += 1 
return self 


def ”Exit (Self, exC tyYDe, exC Val, ex th): 
self.level -= 1 


le On a 
oe ene (6 ' * self.level + text) 


还 不 错 ,是 吧 ? 希望 你 现在 能 熟练 地 在 自己 的 Python 程序 中 使 用 上 下 文 管理 器 和 witp 语句 
了 。 这 两 个 功能 很 不 错 ， 可 以 用 来 以 更 加 有 Python 特色 和 可 维护 的 方式 处 理 资源 管理 问题 。 

如 果 你 还 想 再 找 一 个 练习 来 加 深 理解 ， 可 以 尝试 实现 一 个 使 用 time .time 也 数 来 测量 代码 
块 执行 时 间 的 上 下 文 管理 器 。 一 定 要 试 着 分 别 编写 基于 装饰 器 和 基于 类 的 变 体 ， 以 此 来 彻底 弄 清 
楚 两 者 的 区 别 。 
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2.3.3 ”关键 要 点 





常 处 理 。 





执行 离开 with 上 下 文 时 自动 释放 。 





2.4 下 划 线 、 双 下 划 线 及 其 他 
单 下 划 线 和 双 下 划 线 在 Python 变量 名 和 方法 名 中 都 有 各 自 的 含义 。 有 些 仅 仅 是 作为 约定 ， 
用 于 提示 开发 人 员 ; 而 另 一 些 则 对 Python 解释 器 有 特殊 含义 。 
你 可 能 有 些 疑 惑 ;“Python 中 变量 名 和 方法 名 中 的 单 下 划 线 、 双 下 划 线 到 底 有 什么 含义 ? ” 

我 将 竭尽 全 力 为 你 解释 清楚 。 本 节 将 讨论 以 下 五 种 下 划 线 模式 和 命名 约定 ,以 及 它们 各 自如 何 影 
响 Python 程序 的 行为 。 





口 前 置 单 下 划 线 : _var 

口 后 置 单 下 划 线 : var_ 

口 前 置 双 下 划 线 : _ var 
口 前 后 双 下 划 线 : _var_ 
口 单 下 划 线 : _ 








2.4.1 前 置 单 下 划 线 : var 


口 with 语句 通过 在 所 谓 的 上 下 文 管理 带 中 封装 try. . .finally 语句 的 标准 用 法 来 简化 异 


口 with 语句 一 般 用 来 管理 系统 资源 的 安全 获取 和 释放 。 资 源 首先 由 with 语句 获取 ， 并 在 


口 有 效 地 使 用 with 有 助 于 避免 资源 泄漏 的 问题 ， 让 代码 更 加 易于 阅读 。 





当 涉及 变量 名 和 方法 名 时 ， 前 置 单 下 划 线 只 有 约定 含义 。 它 对 于 程序 员 而 言 是 一 种 提示 























Python 社区 约定 好 单 下 划 线 表达 的 是 某 种 意思 ， 其 本 身 并 不 会 影响 程序 的 行为 。 


前 置 下 划 线 的 意思 是 提示 其 他 程序 员 ， 以 单 下 划 线 开头 的 变量 或 方法 只 在 内 部 使 用 。PEP 8 
中 定义 了 这 个 约定 (PEP 8 是 最 常用 的 Python 代码 风格 指南 ”)。 


不 过 ， 这 个 约定 对 Python 解释 器 并 没有 特殊 含义 。 与 Java 不 同 ，Python 在 “私有 ”和 “ 公 


十” 


a 












































变量 之 间 并 没有 很 强 的 区 别 。 在 变量 名 之 前 添加 一 个 下 划 线 更 像 是 有 人 提 


出 了 一 个 小 小 的 下 





划 线 警告 标志 :“ 注 意 ， 这 并 不 是 这 个 类 的 公共 接口 。 最 好 不 要 使 用 它 。 


来 看 下 面 的 例子 : 


Glass Test: 
站 








〇 详 见 PEP 8: “Style Guide for Python Code”。 
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nee = 
Scie a 8 


如 果实 例 化 这 个 类 并 尝试 访问 在 _init_ 构造 函数 中 定义 的 foo 和 _bar 属性 ,会 发 生 什 
么 情况 ? 


我 们 来 看 看 : 


可 以 看 到 ，_bar 前 面 的 单 下 划 线 并 没有 阻止 我 们 “进入 ”这 个 类 访问 变量 的 值 。 


这 是 因为 Python 中 的 前 置 单 下 划 线 只 是 一 个 公认 的 约定 ， 至 少 在 涉及 变量 名 和 方法 名 时 是 
这 样 的 。 但 是 前 置 下 划 线 会 影响 从 模块 中 导入 名 称 的 方式 。 假 设 在 一 个 名 为 my_module 的 模块 
中 有 以 下 代码 : 


# my_module.py: 
































def external_func(): 
I 2 

de ee 
ee nn 


现在 , 如 果 使 用 通配符 导入 从 这 个 模块 中 导入 所 有 名 称 , Python 不 会 导入 带 有 前 置 单 下 划 线 
的 名 称 〈 除非 模块 中 定义 了 __al1。 列表 覆盖 了 这 个 行为 ”): 























> Eommm noe ns. 
>>> external_func() 


23 
TECN 
UE ee rvs aerial he ee mole Wor nee 





顺便 说 一 下 , 应 避免 使 用 通配符 导入 , 因为 这 样 就 不 清楚 当前 名 称 空间 中 存在 哪些 名 称 了 。” 
为 了 清楚 起 见 ， 最 好 坚持 使 用 常规 导 和 方法。 与 通配符 导 和 不同, 常规 导入 不 受 前 置 单 下 划 线 命 
名 约定 的 影响 : 


SS Moe nM Mel 

>>> my_module.external_func() 
久 3 

> nn te ed 
A 
































GD 详 见 Python 文档 : “Importing * From a Package”。 
@) 详 见 PEP8:“Imports”。 
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这 里 可 能 有 点 混乱 。 但 如 果 你 遵循 PEP 8 的 建议 不 使 用 通配符 导入 ,那么 真正 需要 记 住 的 只 
有 下 面 这 一 条 。 


以 单 下 划 线 开头 的 名 称 只 是 Python 命名 中 的 约定 ， 表 示 供 内 部 使 用 。 它 通常 对 Python 解释 
器 没有 特殊 含义 ， 仅 仅 作 为 对 程序 员 的 提示 。 
2.4.2 ”后 置 单 下 划 线 : var 


有 时 ， 某 个 变量 最 合适 的 名 称 已 被 Python 语言 中 的 关键 字 占 用 。 因 此 ,诸如 class 或 def 
的 名 称 不 能 用 作 Python 中 的 变量 名 。 在 这 种 情况 下 ， 可 以 追加 一 个 下 划 线 来 绕 过 命名 冲突 : 











>>> def make_object (name, class): 
加 


>>> def make_object (name，class_) : 
pass 


总 之 , 用 一 个 后 置 单 下 划 线 来 避免 与 Python 关键 字 的 命名 冲突 是 一 个 约定 。PEP 8 定义 并 解 
释 了 这 个 约定 。 








2.4.3 前 置 双 下 划 线 : _ var 

迄今 为 止 ， 我 们 介绍 的 命名 模式 只 有 约定 的 意义 ， 但 使 用 以 双 下 划 线 开头 的 Python 类 属 ! 
( 变量 和 方法 ) 就 不 一 样 了 。 

双 下 划 线 前 绥 会 让 Python 解释 器 重 写 属性 名 称 ， 以 避免 子 类 中 的 命名 冲突 。 

这 也 称 为 名 称 改写 (name mangling )， 即 解释 器 会 更 改变 量 的 名 称 ， 以 便 在 稍 后 扩展 这 个 类 
时 避免 命名 冲突 。 

听 起 来 很 抽象 ， 下 面 用 代码 示例 来 实验 一 下 : 

class Test: 

Seteeninie (Sere,s: 
SO Ee = 


set bar 228 
Self z= 42 


接着 用 内 置 的 air () 函数 来 看 看 这 个 对 象 的 属性 : 


St) 
SS ee le 








了 

















一 二 

















[Be les 0 er ld oY eee ey 
TT oO Ca eS re Om 

Uo re mo ty SV EX ee ot te 

MO:e CT ev 





reduce _', '_ reduce ex ', '__repr 
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该 函数 返回 了 一 个 包含 对 象 属性 的 列表 。 在 这 个 列表 中 尝试 寻找 之 前 的 变量 名 称 foo、_bar 
baz， 你 会 发 现 一 些 有 趣 的 变化 。 


首先 ，self .foo 变量 没有 改动 ， 在 属性 列表 中 显示 为 foo。 
接着 ，self._par 也 一 样 ， 在 类 中 显示 为 _bar。 前 面 说 了 ， 在 这 种 情况 下 前 置 下 划 线 仅仅 














是 一 个 约定 ， 是 对 程序 员 的 一 个 提示 。 


然而 self .baz 就 不 一 样 了 。 在 该 列表 中 找 不 到 _baz 这 个 变量 。 
_ baz 到 底 发 生 了 什么 
仔细 观察 就 会 看 到 ， de Test baz 的 属 








性。 这 是 Python 解释 器 应 用 











名 称 改写 之 后 的 名 称 ， 是 为 了 防止 子 类 和 覆盖 这 些 变量 。 

















接着 创建 男 一 个 类 来 扩展 Test 类 ， 并 尝试 覆盖 之 前 构造 函数 中 添加 的 属性 : 


class ExtendedTest (Test): 
eto et 


ol 





Se eT (0 er 
SEE ov Lleny 
ET oe = (ONS lol 
SE 0 SS Moe oko 





现在 你 认为 这 个 ExtendedTest 类 实例 上 的 foo、bar 和 ”baz 值 会 是 什么 ”来 一 起 看 看 : 





>>> t2 = ExtendedTest () 

SE 

ROME 

2 2a 

"OverrIadden 

> el 

VA el Ce a Os 

"'ExtendedTest' object has no attribute '_ baz'" 


等 一 下 ， 当 试图 访问 t2 .paz 的 值 时 ， 为 什么 会 得 到 AttributeError? 因为 Python 又 














进行 了 名 称 改写 ! 实际 上 ， 这 个 对 象 甚至 没有 _ paz 属性 : 


SS Che) 


























exeenmlenest nba ns ba clgcsTe. 
eol to US Bol to /cn oe et 
Ce eta ne 
Pe ro NE me ne ot er rt ol = Ube 
Po Pn nm le 入 

WE CLG SEX Oi at 

OS 0 asshnoon 


| 
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baz 变 成 了 ]_FxtendedTest _baz， 但 原来 的 Test_ _baz 

















可 以 看 到 ， 为 了 防止 意外 改动 ， 


>>> t2._ExtendedTest__baz 
'OVerridden' 
S72eReSstea ba 

村 这 








程序 员 无 法 感知 双 下 划 线 名 称 改写 ， 下 面 的 例子 可 以 证 实 这 一 点 : 


class ManglingTest: 
Ser 
self. mangled = 'hello' 


def get_mangled (self): 
return self._ mangled 


>>> ManglingTest () .get_mangled() 


‘hello’ 

> Menem meno 

A DU 

WM OS te 


名 称 改 写 也 适用 于 方法 名 ， 会 影响 在 类 环境 中 所 有 以 双 下 划 线 ( dunder ) 开头 的 名 称 : 


class MangledMethod: 
def _ method(self): 
een 


gere can ee (Selo: 
return self. method() 


>>> MangledMethod()._ method() 

PAs Te DO ee Oe 

"'MangledMethod' object has no attribute '__ method’'™”" 
> MencoleaMesnecan co 

浊 广 


下 面 这 个 名 称 改写 的 示例 可 能 会 令 人 惊讶 : 
_MangledGlobal_ mangled = 23 
class MangledGlobal: 

def test (self): 


return __ mangled 


>>> MangledGlobal() .test () 
23 


这 个 例子 先 声明 _MangledGlobal mangled 为 全 局 变量 , 然后 在 名 为 MangledGlobal 的 
类 环境 中 访问 变量 。 由 于 名 称 改写 , 类 中 的 test () 方 法 仅 用 _ mangled 就 能 引用 _MangleaGlobal 
mangled 全 局 变量 。 
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mangled 以 双 下 划 线 开头 ， 因 此 Python 解释 器 自动 将 名 称 扩 展 为 _MangleqGlobal_ 
mangled。 这 表明 名 称 改写 不 专门 与 类 属性 绑 定 , 而 是 能 够 应 用 于 类 环境 中 所 有 以 双 下 划 线 开头 
的 名 小 。 


这 里 需要 掌握 的 内 容 确实 有 点 多 。 


说 实话 , 我 也 没有 把 这 些 例子 和 解释 记 在 大 脑 中 ,所 以 当初 撰写 这 些 例子 的 时 候 花 了 一 些 时 
间 研 究 和 编辑 。 虽 然 我 有 多 年 的 Python 使 用 经 验 ， 但 大 脑 中 并 没有 一 直 记 着 这 样 的 规则 和 特殊 


情形 。 

有 时 ,程序 员 最 重要 的 技能 是 “模式 识别 ”， 以 及 知道 查找 哪些 内 容 。 如 果 你 目前 还 有 点 不 
知 所 措 ， 不 要 担心 ， 慢 慢 来 ， 继 续 尝试 本 章 中 的 例子 。 

深入 掌握 这 些 概 念 之 后 ， 你 就 能 识别 出 名 称 改写 和 刚刚 介绍 的 其 他 行为 给 程序 带 来 的 影响 。 
如 果 有 一 天 在 实际 工作 中 遇 到 相关 问题 ， 你 应 该 知道 在 文档 中 搜索 哪些 信息 。 















































补充 内 容 : 什么 是 dunder 

如 果 你 听 过 一 些 有 经 验 的 Python 高 手 谈论 Python 或 者 看 过 几 次 Python 会 议 演讲 , 可 能 听 说 
过 dunder 这 个 词 。 如 果 你 还 不 知道 这 是 什么 意思 ， 答 案 马 上 揭晓 。 

在 Python 社区 中 通常 称 双 下 划 线 为 dunder。 因 为 Python 代码 中 经 党 出 现 双 下 划 线 ， 所 以 为 
了 简化 发 音 ，Python 高 手 通 常会 将 “ 双 下 划 线 ”( double underscore ) 简称 为 dunder 。 
































例如 ，__baz 在 英文 中 读 作 dunderbaz。 与 之 类 似 ，_ init _ 读 作 dunderinit， 虽 然 按 道 理 
说 应 该 是 dunderinitdunder。 


但 这 只 是 命名 约定 中 的 男 一 个 癖好 ， 就 像 是 Python 开发 人 员 的 暗号 。 























2.4.4 前 后 双 下 划 线 : _ var 


这 也 许 有 点 令 人 惊讶 一 一 如 果 名 字 前 后 都 使 用 双 下 划 线 , 则 不 会 发 生 名 称 改写 。 前 后 由 双 下 
划 线 包围 的 变量 不 受 Python 解释 器 的 影响 : 
class PrefixPostfixTest: 


ET 
Sedt. Dan = 4 
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然而 , 同时 具有 前 后 双 下 划 线 的 名 称 在 Python 中 有 特殊 用 途 。 像 ”init_ 这样 的 对 象 构造 





中 后续 内 容 中 会 将 dunder 翻译 成 “ 双 下 划 线 方法 ”。 一 一 译 者 注 
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函数 ， 用 来 让 对 象 可 调用 的 _call 函数， 都 遵循 这 条 规则 。 


这 些 双 下 划 线 方法 通常 被 称 为 魔法 方法 , 但 Python 社区 中 的 许多 人 【包括 我 自己 ) 不 喜欢 
这 个 词 。 因 为 这 个 词 像 是 暗示 人 们 要 退 避 三 舍 , 但 实际 上 完全 不 必 如 此 。 双 下 划 线 方法 是 Python 
的 核心 功能 ， 应 根据 需要 使 用 ， 其 中 并 没有 什么 神奇 或 隐 涩 的 内 容 。 

但 就 命名 约定 而 言 , 最 好 避免 在 自己 的 程序 中 使 用 以 双 下 划 线 开头 和 结尾 的 名 称 ， 以 避免 与 nl 
Python 语言 的 未 来 变更 发 生 冲 突 。 


2.4.5 单 下 划 线 : _ 






























































按照 约定 ， 单 下 划 线 有 时 用 作 名 称 ， 来 表示 变量 是 临时 的 或 无 关 紧 要 的 。 
例如 下 面 的 循环 中 并 不 需要 访问 运行 的 索引 ， 那 么 可 以 使 用 _ 来 表示 它 只 是 一 个 临时 值 : 
ne: 


lo me (ane ep Reel 


在 解 包 表 达 式 中 还 可 使 用 单 下 划 线 表示 一 个 “不 关心 ”的 变量 来 忽略 特定 的 值 。 同 样 ， 这 个 
含义 只 是 一 个 约定 ， 不 会 触发 Python 解析 器 中 的 任何 特殊 行为 。 单 下 划 线 只 是 一 个 有 效 的 变量 
名 ， 偶 尔 用 于 该 目的 。 

下 面 的 代码 示例 中 , 我 将 元 组 解 包 为 单独 的 变量 ， 但 其 中 只 关注 color 和 mileage 字段 的 
值 。 可 是 为 了 执行 解 包 表达 式 就 必须 为 元 组 中 的 所 有 值 都 分 配 变量 ， 此 时 _ 用 作 占 位 符 变 量 : 


SS To SY (ne ly ele My, Nel) 
GCT 全 Ce 














RE 
eeQ 

>>> mileage 
3 和 2 
> 

2 


除了 用 作 临 时 变量 之 外 ，_ 在 大 多 数 Python REPL 中 是 一 个 特殊 变量 ,表示 由 解释 器 计算 的 
上 一 个 表达 式 的 结果 。 


如 果 正 在 使 用 解释 器 会 话 ， 用 下 划 线 可 以 方便 地 获取 先前 计算 的 结果 : 


>S3200 3 
2 

> 

区 站 

SS oie 
写本 


如 果 正 在 实时 构建 对 象 ， 有 单 下 划 线 的 话 不 用 事先 指定 名 称 就 能 与 之 交互 : 
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20 lo) 

天 

>>> _.append(1) 
>>> _.append(2) 
SS "dpDpendt(t3y 


> 


B23 


2.4.6 ”关键 要 点 


口 前 置 单 下 划 线 _var: 命名 约定 ， 用 来 表示 该 名 称 仅 在 内 部 使 用 。 一 般 对 Python 解释 器 没 
有 特殊 含义 (通配符 导入 除外 )， 只 能 作为 对 程序 员 的 提示 。 

口 后 置 单 下 划 线 var_: 命名 约定 ， 用 于 避免 与 Python 关键 字 发 生命 名 冲突 。 

口 前 置 双 下 划 线 ”var: 在 类 环境 中 使 用 时 会 触发 名 称 改写 ,对 Python 解释 器 有 特殊 含义 。 
口 前 后 双 下 划 线 _ var _: 表示 由 Python 语言 定义 的 特殊 方法 。 在 自 定 义 的 属性 中 要 避免 
使 用 这 种 命名 方式 。 

口 单 下 划 线 _: 有 时 用 作 临 时 或 无 意义 变量 的 名 称 ( “不 关心 ” )。 此 外 还 能 表示 Python REPL 
会 话 中 上 一 个 表达 式 的 结 


2.5 字符 串 格 式 化 中 令 人 震惊 的 真相 


“Python 之 祥 ” 告 诚 人 们 ,应 该 只 用 一 种 明确 的 方式 去 做 某 件 事 。 当 你 发 现在 Python 中 有 四 
种 字符 串 格 式 化 的 主要 方法 时 ， 可 能 会 颇 感 费解 。 

本 节 将 介绍 这 四 种 字符 串 格式 化 方法 的 工作 原理 以 及 它们 各 自 的 优 缺 点 。 除 此 之 外 , 还 会 介 
绍 简单 的 “经 验 法 则 ”， 用 来 选择 最 合适 的 通用 字符 串 格 式 化 方法 。 

闲话 不 多 说 , 后续 还 有 很 多 内 容 需 要 讨论 。 下 面 用 一 个 简单 的 示例 来 实验 , 假设 有 以 下 变量 
(或 常量 ) 可 以 使 用 : 


人 
>>> name = 'Bopb' 


基于 这 些 变量 ， 我 们 希望 生成 一 个 输出 字符 串 并 显示 以 下 错误 消息 : 
BES BO a On 
这 个 错误 可 能 会 在 周一 早上 破坏 开发 人 员 的 好 心情 ! 不 过 我 们 的 目的 是 讨论 字符 串 格式 化 ， 
所 以 直接 开始 吧 。 
2.5.1 第 一 种 方法 : “旧式 ”字符 串 格式 化 


Python 内 置 了 一 个 独特 的 字符 串 操作 : 通过 8 操作 符 可 以 方便 快捷 地 进行 位 置 格式 化 。 如 果 
你 在 C 中 使 用 过 printf 风格 的 函数 ， 就 会 立即 明白 其 工作 方式 。 这 里 有 一 个 简单 的 例子 : 
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>>> 'Hello, %s' % name 
WHEL OB Ol 


这 里 使 用 ss 格式 说 明 符 来 告诉 Python 替换 name 值 的 位 置 。 这 种 方式 称 为 “旧式 ”字符 串 
格式 化 。 


在 旧式 字符 串 格 式 化 中 , 还 有 其 他 用 于 控制 输出 字符 串 的 格式 说 明 符 。 例 如 ， 可 以 将 数 转换 
为 十 六 进 制 符号 ， 或 者 填充 空格 以 生成 特定 格式 的 表格 和 报告 。” 


下 面 使 用 sx 格式 说 明 符 将 int 值 转换 为 字符 串 并 将 其 表示 为 十 六 进 制 数 : 


Se 
Paac0OFFee 

















oo 











如 果 要 在 单个 字符 串 中 进行 多 次 替换 ， 需 要 对 “旧式 ”字符 串 格式 化 语法 稍 作 改 动 。 由 于 
操作 符 只 接受 一 个 参数 ， 因 此 需要 将 字符 串 包装 到 右边 的 元 组 中 ， 如 下 所 示 : 


>>> 'Hey %s, there is a 0x%x error!' %$ (name, errno) 
HOV BO nore a or 


如 果 将 别名 传递 给 s 操 作 符 ， 还 可 以 在 格式 字符 串 中 按 名 称 蔡 换 变量 : 


> ev ame ro 0 (nm on 
"name": name, "errno": errno } 'Hey 
Bob Nene To 0xDadeO ri elo, 


这 种 方式 能 简化 格式 字符 串 的 维护 , 将 来 也 容易 修改 。 不必 确 保 字 符 串 值 的 传递 顺序 与 格式 
字符 串 中 名 称 的 引用 顺序 一 致 。 当 然 ， 这 种 技巧 的 缺点 是 需要 多 打点 字 。 


相信 你 一 直 在 想 ， 为 什么 将 这 种 printf 风格 的 格式 化 称 为 “旧式 ”字符 串 格 式 化 。 这 是 因 
为 在 技术 上 有 “新 式 ” 的 格式 化 方法 取代 了 它 ， 马 上 就 会 介绍 。 尽 管 “旧式 ”字符 串 格式 化 已 经 
不 再 受 重用 ,但 并 未 被 抛弃 ，Python 的 最 新 版 本 依然 支持 。 
























































2.5.2 第 二 种 方法 : “新 式 ” 字 符 串 格式 化 


Python 3 引入 了 一 种 新 的 字符 串 格式 化 方式 ， 后 来 又 移植 到 了 Python 2.7 中 。“ 新 式 ” 字 符 串 
格式 化 可 以 免 去 8 操作 符 这 种 特殊 语法 ， 并 使 得 字符 串 格 式 化 的 语法 更 加 规整 。 新 式 格式 化 在 字 
符 串 对 象 上 调用 format () 函数 。” 


与 “旧式 ”格式 化 一 样 ， 使 用 format () 函数 可 以 执行 简单 的 位 置 格式 化 : 


> lo enimee (ene 
SCVNOP BO 




















Oz 详 见 Python 文档:“printf-style String Formatting”。 
和 评 九 Python 义 何 : str.format() 。 
©® sp Py ph 文档 加 f. 7 
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你 还 可 以 用 别名 以 任意 顺序 赫 换 变 量 。 这 是 一 个 非常 强大 的 功能 , 不 必修 改 传递 给 格式 函数 
的 参数 就 可 以 重新 排列 显示 顺序 : 
TESTE ES 二 TEL 


ee name=name, errno=errno) 
Ly Bo EINE le er [Oboerele ln to 


从 上 面 可 以 看 出 ,将 int 变量 格式 化 为 十 六 进 制 字符 串 的 语法 也 改变 了 。 现 在 需要 在 变量 
名 后 面 添加 :x 后 级 来 传递 格式 规范 。 

总 体 而 言 ， 这 种 字符 串 格 式 化 语法 更 加 强大 ， 也 没有 额外 增加 复杂 性 。 阅 读 Python 文档 "对 
字符 串 格式 化 语法 的 描述 是 值得 的 。 

在 Python 3 中 ， 这 种 “新 式 ” 字 符 串 格 式 化 比 s 风 格 的 格式 化 更 受 欢 迎 。 但 从 Python 3.6 开 
始 ， 出 现 了 一 种 更 好 的 方式 来 格式 化 字符 串 ， 下 一 节 会 详细 介绍 。 




















2.5.3 ”第 三 种 方法 : 字符 串 字 面值 插值 (Python 3.6+) 


Python 3.6 增加 了 男 一 种 格式 化 字符 串 的 方法 ， 称 为 格式 化 字符 串 字 面值 (formatted string 
literal )。 采用 这 种 方法 , 可 以 在 字符 串 常量 内 使 用 般 入 的 Python 表达 式 。 我 们 通过 下 面 这 个 简单 
的 示例 来 体验 一 下 该 功能 : 


>>> f'Hello, {name}!' 
WEN DO 


这 种 新 的 格式 化 语法 非常 强大 。 因 为 其 中 可 以 般 入 任意 的 Python 表达 式 ， 所 以 甚至 能 内 联 
算术 运算 ， 如 下 所 示 : 
































> 

SS B=0 

EES Ee ne Eo so oo oo (Yo) 

Ua ol oe ei ls eael ove SOW 

本 质 上 ， 格式 化 字符 串 字 面值 是 Python 解析 器 的 功能 : 将 £ 字符 串 转换 为 一 系列 字符 串 常 
量 和 表达 式 ， 然 后 合并 起 来 构建 最 终 的 字符 串 。 

假设 有 如 下 的 greet () 函数 ， 其 中 包含 f 字符 串 : 


>>> def greet (name, question): 
nae ene lel eo he ron/ Me one on 














SS Torneo Meroe 
na oy JEolod oo Me hie ano or el 





Oz 详 见 Python 文档 : “Format String Syntax”。 
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在 剖析 函数 并 明白 其 本 质 后 ,就 可 以 得 知 函数 中 的 £ 字符 串 实 际 上 转换 成 了 类 似 以 下 的 内 容 : 


>>> def greet (name, question): 
Tetum ele me Tov si 
SET 人 





CPython 的 实际 实现 比 这 种 方式 稍 快 ,因为 其 中 使 用 BUILD_STRING 操作 码 进行 了 优化 ," 但 
两 者 在 功能 上 是 相同 的 : 


Sm es 
> ee eet 























2 OORNDEGIONTSAR (ESI 

2 LOAD_FAST 0 (name) 
4 FORMAT_VALUE 0 
ODN (EW et 
8 LOAD FAST 1 (question) 

10 FORMAT_VALUE 

2 TA NSE S(O 

Ia BUTEDESTRING 5 

16 RETURN_VALUE 





字符 串 字 面值 也 支持 str .format () 方 法 所 使 用 的 字符 串 格 式 化 语法 ,因此 可 以 用 相同 的 方 
式 解 决 前 两 节 中 过 到 的 格式 化 问题 : 


>>> f"Hey {name}, there's a {errno:#x} error!" 
"Hey Bob, there's a Oxbadc0Offee error!" 





Python 新 的 格式 化 字符 串 字 面值 与 ES2015 中 添加 的 JavaScript 模 板 字 面值 (template literal ) 
类 似 。 我 认为 这 对 各 个 语言 来 说 都 是 一 个 很 好 的 补充 , 并 且 已 经 开始 在 Python 3 的 日 常 工作 中 使 
用 。 你 可 以 在 官方 Python 文档 "中 了 解 更 多 有 关 格式 化 字符 串 字面 值 的 信息 。 














2.5.4 ”第 四 种 方法 : 模板 字符 串 


Python 中 的 男 一 种 字符 串 格 式 化 技术 是 模板 字符 串 ( template string )。 这 种 机 制 相对 简单 ， 
也 不 太 强 大 ,但 在 某 些 情况 下 可 能 正 是 你 所 需要 的 。 


来 看 一 个 简单 的 问候 示例 : 


S00 Deonm ee ne Tenaeee 
>>> 七 = Template('Hey, S$name!') 
>>> t.substitute (name=name) 
EE 

















从 上 面 可 以 看 到 ， 这 里 需要 从 Python 的 内 置 字 符 串 模 块 中 导入 Template 类 。 模 板 字 符 目 
不 是 核心 语言 功能 ， 而 是 由 标准 库 中 的 模块 提供 。 





Ud 



































GD 详 见 Python 3 bug-tracker issue #27078。 
@) 详 见 Python 文档 : “Formatted string literals”。 
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另 一 个 区 别 是 模板 字符 串 不 能 使 用 格式 说明 符 。 因 此 , 为 了 让 之 前 的 报错 字符 串 示 例 正 常 工 
作 ， 需 要 手动 将 int 错误 码 转 换 为 一 个 十 六 进 制 字符 串 : 





mol re me ee So or lo 
>>> Template(templ_ string) .substitutel 
name=name, error=hex(errno)) 'Hey 


Bopb He er 0a er on 

















结果 不 错 ， 但 是 你 可 能 想 知道 什么 时 候 应 该 在 Python 程序 中 使 用 模板 字符 串 。 在 我 看 来 ， 
最 佳 使 用 场景 是 用 来 处 理 程序 用 户 生 成 的 格式 字符 串 。 因 为 模板 字符 串 较 为 简单 , 所 以 是 更 安全 
的 选择 。 


其 他 字符 串 格 式 化 技术 所 用 的 语法 更 复杂 ， 因 而 可 能 会 给 程序 带 来 安全 漏洞 。 例如， 格式 字 
符 串 可 以 访问 程序 中 的 任意 变量 。 



































这 意味 着 ,如 果 有 恶意 用 户 可 以 提供 格式 字符 串 , 那么 就 可 能 泄露 密 钥 和 其 他 敏感 信息 ! 下 面 
用 一 个 示例 来 简单 演示 一 下 这 种 攻击 方式 : 
SR nn a seo, 


SS ela Eo 
le oe (See 








ce pass 
Ed 
民生 





# 啊 哦 Ee 
> 
Val le Er ee ! 


注意 看 ,假想 的 攻击 者 访问 格式 字符 串 中 的 _globals。_ 字典 ， 从 中 提取 了 秘密 的 字符 串 。 
吓人 吧 ? 用 模板 字符 串 就 能 避免 这 种 攻击 。 因 此 ， 如 果 处 理 从 用 户 输入 生成 的 格式 字符 串 ， 用 模 
板 字 符 串 更 加 安全 。 





有 
>>> TemplLatel(user_input) .substitute(error=err) 
ValueError: 


CC OC 人 富有 


2.5.5 ”如 何 选择 字符 串 格式 化 方法 


我 完全 明白 , Python 提供 的 多 种 字符 串 格式 化 方法 会 让 你 感到 非常 困惑 。 现 在 或 许 应 该 画 一 
些 流程 图 来 解释 。 


但 我 不 打算 这 样 做 ， 而 是 归纳 一 个 编写 Python 代码 时 可 以 遵循 的 简单 经 验 法 则 。 
































当 难 以 决定 选择 哪 种 字符 串 格式 化 方法 时 ， 可 以 结合 具体 情况 使 用 下 面 这 个 经 验 法 则 。 
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达 恩 的 Python 字符 串 格式 化 经 验 法 则 : 
如 果 格 式 字符 囊 是 用 户 提供 的 ,使 用 模板 字符 囊 来 避免 安全 问题 。 如 果 不 是 ， 再 考虑 
Python 版 本 : Python 3.6+ 使 用 字符 串 字面 值 插值 ， 老 版 本 则 使 用 “新 式 ”字符 串 格式 化 。 
2.5.6 ”关键 要 点 


口 也 许 有 些 令 人 惊讶 ， 但 Python 有 不 止 一 种 字符 串 格式 化 的 方式 。 
口 每 种 方式 都 有 其 优 缺 点 ， 使 用 哪 一 种 取决 于 具体 情况 。 
口 如 果 难 以 选择 ， 可 以 试 试 我 的 字符 串 格式 化 经 验 法 则 。 











2.6 “Python 之 祥 ” 中 的 彩蛋 


虽然 介绍 Python 的 图 书 普遍 会 提 到 Tim Peters 的 “Python 之 祥 ”， 但 这 段 话 的 确 值 得 再 次 提 
及 。 许 多 年 来 ， 我 一 直 从 中 受益 ，Tim 的 话 让 我 成 为 更 优秀 的 程序 员 ， 和 希望 你 也 能 从 中 受益 。 

此 外 ,“Python 之 禅 ”还 作为 彩蛋 藏 在 Python 语言 当中 。 只 需 进 入 Python 解释 器 会 话 并 运行 
以 下 命令 就 能 看 到 : 











EC 
Python 之 祥 一 一 Tim Peters 


美丽 好 过 了 丑陋， 

浅显 好 过 隐 了 眩 ， 

简单 好 过 复合 ， 

复合 好 过 复杂 ， 

扁平 好 过 诅 套 ， 

稀 了 足 好 过 密集 ， 

可 读 性 最 重要 ， 

即使 祭 出 实用 性 为 理由 ， 特 例 也 不 可 违背 这 些 规则 。 

不 应 默认 包容 所 有 错误 ， 得 由 人 明确 地 让 它 闭 嘴 ! 

面 对 太 多 的 可 能 ， 不 要 尝试 猜测 ， 应 该 有 一 个 〈 而且 是 唯一 ) 直 白 的 解决 方法 。 
当然 ， 找 到 这 个 方法 不 是 件 容易 的 事 ， 谁 叫 你 不 是 荷兰 人 呢 ! 
但 是 ， 现 在 就 做 永远 比 不 做 要 好 。 

若 实现 方案 很 难 解释 ， 那 么 它 就 不 是 一 个 好 方案 ; 反之 也 成 立 ! 
名 称 空间 是 个 绝妙 想法 一 一 现在 就 来 共同 体验 和 增进 这 些 吧 | ” 

















@ 中 文 版 来 自 ZoomQuite ( 大妈) 。 一 一 译 者 注 











3.1 函数 是 Python 的 头等 对 象 

函数 是 Python 的 头等 对 象 。 可 以 把 函数 分 配给 变量 、 存 储 在 数据 结构 中 、 作 为 参数 传递 给 
其 他 函数 ， 甚 至 作为 其 他 函数 的 返回 值 。 

深入 掌握 这 些 概念 不 仅 有 助 于 理解 Python 中 像 lambda 和 装饰 器 这 样 的 高 级 特性 ， 而 且 会 让 
你 接触 函数 式 编 程 技术 。 

接 下 来 的 几 页 将 通过 一 些 示例 帮助 你 对 这 些 概念 形成 直观 的 理解 。 这 些 示 例 循 序 渐进 ,因此 
需要 按 顺 序 阅 读 ， 并 不 断 在 Python 解释 右 会 话 中 尝试 。 

理解 这 些 概念 可 能 需要 比较 长 的 时 间 。 别 担心 ， 这 完全 正常 ,我 也 经 历 过 。 你 开始 可 能 会 觉 
得 毫 无 头绪 ， 但 学 习 到 一 定 程 度 后 就 会 豁然 开 庆 。 

本 章 会 使 用 下 面 这 个 yel1 函数 来 演示 相关 功能 。 这 是 个 简单 的 示例 ， 输 出 的 内 容 很 简单 。 


def yell (text): 
lev ne er 



























































SS ne 
HEEEOL® 


3.1.1 了 葡 数 是 对 象 

Python 程序 中 的 所 有 数据 都 是 由 对 象 或 对 象 之 间 的 关系 来 表示 的 。? 字 符 串 、 列 表 和 模块 等 
都 是 对 象 。Python 中 的 函数 也 不 例外 ， 同 样 是 对 象 。 

由 于 yell 函数 是 Python 中 的 一 个 对 象 , 因此 像 任何 其 他 对 象 一 样 , 也 可 以 将 其 分 配给 另 一 


< 上 
个 变量 : 











GD 详 见 Python 文档 : “Objects, values and types”。 
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> one el 


这 一 行 没 有 调用 函数 ,而 是 获取 yel1 引用 的 函数 对 象 ,再 创建 一 个 指向 该 对 象 的 名 称 bark。 
现在 调用 Park 就 可 以 执行 相同 的 底层 函数 对 象 : 


> om (oo 
WOE 


函数 对 象 及 其 名 称 是 相互 独立 的 实体 ,下面 来 验证 一 下 。 先 删除 该 函数 的 原始 名 称 ( yel1 )， 
由 于 男 一 个 名 称 ( bark ) 仍然 指向 底层 函数 ， 因 此 仍然 可 以 通过 bark 调用 该 函数 : 



































>>> del yell 





>>> yell('hello?') 
NameError: "name 'yell' is not defined" 


>>> bark('hey') 
SEE 


顺便 说 一 句 ，Python 在 创建 函 0 只 符 。 使 用 
_name ”属性 可 以 访问 这 个 内 部 标识 符 : 








>>> bark._ name _ 
SE 


虽然 函 数 的 _ name _ 仍然 是 yell,， 但 已 经 无 法 用 这 个 名 称 在 代码 中 访问 也 数 对 象 。 名 称 标 
识 符 仅 仅 用 来 辅助 调试 ， 指 向 函数 的 变量 和 函数 本 身 实际 上 是 彼此 独立 的 。 


3.1.2 ”函数 可 存储 在 数据 结构 中 


由 于 函数 是 头等 对 象 , 因此 可 以 像 其 他 对 象 一 样 存储 在 数据 结构 中 。 例如 ,可 以 将 函数 添加 
到 列表 中 : 


Se eal eleva om re Meo es le 
>>> funcs 

和 

eel ew ea nee ee 

=netehnod Coleall er oi tr ESsSE SEE 


访问 存储 在 列表 中 的 函数 对 象 与 访问 其 他 类 型 的 对 象 一 样 . 


SS I ny Me 

Dee 
ed El 
<method 'lower' of 'str' objects> 'hey there' 
<moenocm oc ae or Som Opes Hey {heme 





















































Q@ 从 Python 3.3 开始 加 入 了 作用 相似 的 _oualname ， 用 来 返回 限定 名 称 ( qualified name ) 字符 串 ， 以 消除 函数 和 
类 名 的 歧义 ( 详 见 PEP3155 ) 。 
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存储 在 列表 中 的 函数 对 象 可 以 直接 调用 ,无 须 事先 为 其 分 配 一 个 变量 。 比 如 , 在 单个 表达 式 
中 查找 函数 ， 然 后 立即 调用 这 个 “没有 实体 ”的 函数 对 象 。 











33 Te (ne OU 
Wah 3 


3.1.3 ”函数 可 传递 给 其 他 函数 





由 于 函数 是 对 象 ， 因 此 可 以 将 其 作为 参数 传递 给 其 他 函数 。 下 面 这 个 greet 函数 将 另 一 个 
函数 对 象 作为 参数 ， 用 这 个 函数 来 格式 化 问候 字符 串 ， 然 后 输出 结果 : 























def greet (func): 
ere Ee El 


IT am eo eh DEodram 
print (greeting) 











传递 不 同 的 函数 会 产生 不 同 的 结果 ， 向 greet 函数 传递 bark 了 男 数 会 得 到 下 面 这 个 结 


>>> greet (bark) 
'HI, I AM A PYTHON PROGRAM!' 








当然 ， 还 可 以 定义 一 个 新 的 函数 来 产生 不 同形 式 的 问候 语 。 例 如 ， 如 果 不 希 望 这 个 Python 
程序 在 问候 时 听 起 来 像 掌 天 柱 那样 声音 浑厚 ， 那 么 可 以 使 用 下 面 的 whisper 函数 : 











def whisper (text): 
return text.lower() + ' 


>>> greet (whisper) 
OO 








将 函数 对 象 作为 参数 传递 给 其 他 函数 的 功能 非常 强大 , 可 以 用 来 将 程序 中 的 行为 抽象 出 来 并 
传递 出 去 。 在 这 个 例子 中 ，greet 函数 保持 不 变 ， 但 传递 不 同 的 问候 行为 能 得 到 不 同 的 结果 


用 侍 唱 木 o 




















能 接受 其 他 函数 作为 参数 的 函数 被 称 为 高 阶 函数 。 高 阶 函数 是 函数 式 编程 风格 中 必 不 可 少 的 
一 部 分 。 














Python 中 具有 代表 性 的 高 阶 函数 是 内 置 的 map 函数 。map 接受 一 个 函数 对 象 和 一 个 可 迭代 
对 象 ， 然 后 在 可 迭代 对 象 中 的 每 个 元 素 上 调用 该 函数 来 生成 结 





下 面 通过 将 bark 函数 映射 到 多 个 问候 语 中 来 格式 化 字符 串 : 


(nl le le) 
We | 





从 上 面 可 以 看 出 ，map 遍历 整个 列表 并 将 bark 函数 应 用 于 每 个 元 素 。 所 以 ， 现 在 得 到 一 个 
新 列表 对 象 ， 其 中 包含 修改 后 的 问候 语 字 符 串 








O 
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3.1.4 ”函数 可 以 髓 套 


也 许 有 点 出 人 意料 , 不 过 Python 允许 在 函数 中 定义 函数 , 这 通常 被 称 为 能 套 函 数 或 内 部 函数 。 
来 看 下 面 的 例子 : 


def speak (text): 
def whisper (t): 
return t.lower() + 
return whisper (text) 


>>> speak('Hello, World') 
BEY OO OL 





这 里 发 生 了 什么 ”每 次 调用 speak 时 ， 都 会 定义 一 个 新 的 内 部 函数 whisper 并 立即 调用 。 
从 这 里 开始 ， 我 有 点 迷糊 了 ， 但 总 而 言 之 还 算 相 对 简单 。 


但 有 个 问题 ，whi sper 只 存在 于 speak 内 部 : 





En (ee 
NameError: 
WE ne ao i oe (oe a 


>>> speak.whisper 
bai TD OE Te OS 
WO EO ODNECEe SO er Sl 


那 怎 么 才能 从 speak 外 部 访问 般 套 的 whisper 函数 呢 ? 由 于 函数 是 对 象 , 因此 可 以 将 内 部 
函数 返回 给 父 函 数 的 调用 者 。 


例如 ,下 面 这 个 函数 定义 了 两 个 内 部 函数 。 顶层 函数 根据 传递 进来 的 参数 向 调用 者 返回 对 应 
的 内 部 函数 : 


def get_speak_func(volume): 
def whisper (text): 
Botner 
def yell (text): 
return text.upper() + '!' 
TE elves > 053 
return yell 
else: 
return whisper 

















注意 ，get_speak_func 实际 上 不 调用 任何 内 部 函数 ， 只 是 根据 volume 参数 选择 适当 的 
内 部 函数 ， 然 后 返回 这 个 函数 对 象 : 


>>> get_speak_func(0.3) 
<function get_speak func.<locals>.whisper at 0x10ae18> 





>>> get_speak_func(0.7) 
RE 
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返回 的 函数 既 可 以 直接 调用 ， 也 可 以 先 指 定 一 个 变量 名 称 再 使 用 : 


SSaKk Linc T= et spa ine tO 7 
>>> speak_func('Hello') 
SH 


要 深入 领会 一 下 这 里 的 概念 。 这 意味 着 函数 不 仅 可 以 通过 参数 接受 行为 ， 还 可 以 返回 行为 。 
很 酷 吧 ? 


这 些 内 容 有 点 多 。 在 继续 写作 之 前 ， 我 要 哆 杯 咖 啡 休息 一 下 ( 建议 你 也 休息 一 下 )。 











3.1.5 ”函数 可 捕捉 局 部 状态 


前 面 介绍 了 洱 数 可 以 包含 内 部 函数 ， 甚 至 可 以 从 父 函 数 返 回 ( 默认 情况 下 看 不 见 的 ) 内 部 
a 


现在 做 好 准备 ， 下 面 将 进入 函数 式 编程 中 较 深 的 领域 。( 你 刚刚 休息 了 一 会 儿 ， 对 吧 ? ) 
内 部 函数 不 仅 可 以 从 父 函 数 返 回 , 还 可 以 捕获 并 携带 父 函 数 的 某 些 状态 。 这 是 什么 意思 呢 ? 


下 面 对 前 面 的 get_speak_func 示例 做 些小 改动 来 逐步 说 明 这 一 点 。 新 版 在 内 部 就 会 使 用 
volume 和 text 参数 ， 因 此 返回 的 函数 是 可 以 直接 调用 的 : 



































def get_speak_func (ext，Volume) : 

def whisper(): 

return text.lower() + ' 
def yell(): 

return text.upper() + '!'"' 
ne OS 

return yell 
else: 

return whisper 


CO 
‘HELLO, WORLD!' 


仔细 看 看 内 部 函数 whisper 和 yel1,， 注意 其 中 并 没有 text 参数 。 但 不 知 何故 ， 内 部 函数 
仍然 可 以 访问 在 父 函 数 中 定义 的 text 参数 。 它 们 似乎 捕捉 并 “ 记 住 ”了 这 个 参数 的 值 。 


拥有 这 种 行为 的 函数 被 称 为 词法 闭 包 (lexical closure )， 简 称 闭 包 。 闭 包 在 程序 流 不 在 闭 包 
范围 内 的 情况 下 ， 也 能 记 住 封闭 作用 域 (enclosing scope ) 中 的 值 。 

实际 上 , 这 意味 着 函数 不 仅 可 以 返回 行为 ,还 可 以 预先 配置 这 些 行为 。 用 男 一 个 例子 来 演示 
一 下 : 

def make adder (n): 


def add(x): 
et 区 二 
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return add 


>>> plus_3 = make_adder (3) 
>>> us mkescdder(s) 


> 
6 
> 
易 


在 这 个 例子 中 , make_adqqer 作为 工厂 函数 来 创建 和 配置 各 种 adder 函数 。 注 意 , 这 些 adder 
函数 仍然 可 以 访问 make_adqer 荫 数 中 位 于 封闭 作用 域 中 的 参数 n。 











3.1.6 ”对 象 也 可 作为 函数 使 用 

虽然 Python 中 的 所 有 函数 都 是 对 象 ， 但 反之 不 成 立 。 有 些 对 象 不 是 函数 ， 但 依然 可 以 调用 ， 
因此 在 许多 情况 下 可 以 将 其 当 作 函数 来 对 待 。 

如 果 一 个 对 象 是 可 调用 的 ， 意 味 着 可 以 使 用 圆 括号 函数 调用 语法 ， 甚 至 可 以 传人 调用 参数 。 
这 些 都 由 cal1__ 双 下 划 线 方法 完成 。 下 面 这 个 类 能 够 定义 可 调用 对 象 ; 














class Adder: 
GE amMe (ele, vis 
SE 


clefon neo oe 0 : 
return self.n + x 


> Luss Add eeey 
Et 

















在 幕后 ， 像 函数 那样 “调用 ”一 个 对 象 实例 实际 上 是 在 尝试 执行 该 对 象 的 _call_ 方法 。 


当然 ， 并 不 是 所 有 的 对 象 都 可 以 调用 ， 因 此 Python 内 置 了 callable 函数 ， 用 于 检查 一 个 
对 象 是 否 可 以 调用 。 























> vallable(DLlusid) 
True 

>>> callable (yell) 
True 

>>> callable('hello') 
Ealse 


3.1.7 关键 要 点 


口 Python 中 一 切 丝 为 对 象 ， 函 数 也 不 例外 。 可 以 将 函数 分 配给 变量 或 存储 在 数据 结构 中 。 
作为 头等 对 象 ， 函 数 还 可 以 被 传递 给 其 他 函数 或 作为 其 他 函数 的 返回 值 。 
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3.2 





口 头等 函数 的 特性 可 以 用 来 抽象 并 传递 程序 中 的 行为 。 
口 函数 可 以 骨 套 并且 可 以 捕获 并 携带 父 函 数 的 一 些 状态 。 具 有 这 种 行为 的 函数 称 为 闭 包 。 
口 对 象 可 以 被 设置 为 可 调用 的 ， 因 此 很 多 情况 下 可 以 将 其 作为 函数 对 待 。 


lambda 是 单 表 达 式 函数 
Python 中 的 1ambgda 关键 字 可 用 来 快速 声明 小 型 匿名 也 数 。lambda 函数 的 行为 与 使 用 def 




































































关键 字 声 明 的 常规 函数 一 样 ， 可 以 用 于 所 有 需要 函数 对 象 的 地 方 。 





下 面 定 义 一 个 简单 的 lambda 函数 ， 用 于 进行 加 法 运算 : 


Sd hammoa we. Up 
Sh(s 
8 


用 aef 关键 字 能 声明 相同 的 aaa 函数 ， 但 稍微 宛 长 一 些 : 


S33 OEE CoGhG VA) 
Se return wr Yy 
tcl 

8 


你 可 能 想 知 道 lambda 有 什么 独特 之 处 : 如 细 











只 是 比 用 aef 声明 函数 稍微 方便 一 点 ， 那 有 什 





‘i 
区 
/ 


么 大 不 了 的 ? 





来 看 下 面 的 例子 ， 同 时 脑海 里 要 记 着 函数 表达 式 这 个 概念: 

TE 

发 生 了 什么 呢 ? 这 里 用 lampaqa 内 联 定义 了 一 个 加 法 函数 ,然后 立即 用 参数 5 和 3 进行 调用 。 
从 概念 上 讲 ，lambda 表达 式 1ambda x, y: x + y 与 用 def 声明 函数 相同 ， 但 从 语法 上 来 





说 表达 式 位 于 lambda 内 部 。 两 者 的 关键 区 别 在 于 ，lambda 不 必 先 将 函数 对 象 与 名 称 绑 定 ， 只 需 
在 lambda 中 创建 一 个 想 要 执行 的 表达 式 ， 然 后 像 普通 函数 那样 立即 调用 进行 计算 。 


花 了 不 少时 间 才 掌握 这 些 内 容 。 如 果 你 在 理解 这 些 知识 的 时 候 花 费 了 一 点 时 间 , 不 用 担心 , 这 是 











在 继续 学 习 之 前 , 最 好 先 自己 尝试 一 下 前 面 的 代码 示例 来 深入 理解 其 中 的 含义 。 我 自己 当初 














值得 的 。 





lambda 和 普通 函数 定义 之 间 还 有 为 一 个 语法 差异 。lambda 函数 只 能 含有 一 个 表达 式 ， 这 意 








味 着 lambda 函数 不 能 使 用 语句 或 注解 (annotation )， 甚 至 不 能 使 用 返回 语句 。 


那么 应 该 如 何 从 lambda 返回 值 呢 ? 执行 lambda 函数 时 会 计算 其 中 的 表达 式 ， 然 后 自动 返回 

















表达 式 的 结果 , 所 以 其 中 总 是 有 一 个 隐 式 的 返回 表达 式 。 因 此 有 些 人 把 lambda 称 为 单 表达 式 函 数 。 
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3.2.1 _ lambda 的 使 用 场景 


应 该 在 什么 时 候 使 用 lambda 函数 呢 ? 从 技术 上 讲 ， 每 当 需 要 提供 一 个 函数 对 象 时 ， 就 可 以 
使 用 lambda 表达 式 。 而 且 ， 因 为 lambda 是 匿名 的 ， 所 以 不 需要 先 分 配 一 个 名 字 。 


因此 ，lambda 能 方便 灵活 地 快速 定义 Python 函数 。 我 一 般 在 对 可 迭代 对 象 进行 排序 时 ， 使 
用 lambda 表达 式 定 义 简 短 的 key 函数 : 





























SES oe SL oY) lo Mo yy lay ey sy Xe 
SS SOrted(ltuples, Kevslambaa wR 人 TL) 
(4 (2 (el 


上 面 的 例子 按照 每 个 元 组 中 的 第 2 个 值 对 元 组 列表 进行 排序 。 在 这 种 情况 下 ， 用 lambda 区 
数 能 快速 修改 排序 顺序 。 下 面 是 男 一 个 排序 示例 : 


SS SOrted tancdet=d. 0 Kevyslaanbaa Kew 
[OR SI 1 a a | 




















前 面 展 示 的 两 个 示例 在 Python 内 部 都 有 更 简洁 的 实现 ， 分 别 是 operator.itemgetter () 
和 abs () 函数 。 但 我 希望 你 能 从 中 看 出 lambda 带 来 的 灵活 性 。 想 要 根据 某 个 键 值 的 计算 结果 对 
序列 排序 ? 没 问题 ， 现 在 你 应 该 知道 怎么 做 了 。 


lambda 还 有 一 个 有 趣 之 处 : 与 普通 的 舱 套 函数 一 样 ，lambda 也 可 以 像 词法 闭 包 那样 工作 。 


词法 闭 包 是 什么 ?这 只 是 对 某 种 函数 的 一 个 奇特 称呼 , 该 函数 能 记 住 来 自 茶 个 封闭 词法 作用 
域 的 值 ， 即 使 程序 流 已 经 不 在 作用 域 中 也 不 例外 。 下 面 用 一 个 ( 相当 学 术 的 ) 例子 来 演示 这 个 


田 相 . 


DN» 













































































>>> def make_adder (n): 
return lambda x: x +n 


make adder (3) 
make adder (5) 


> 
bt 
> 
SS 
9 








在 上 面 的 例子 中 ， 即使 n 是 在 make_adder 函数 (封闭 的 作用 域 ) 中 定义 的 ， 但 x + nlambda 
仍然 可 以 访问 n 的 值 。 


有 了 时， 与 def 关键 字 声 明 的 散 套 哨 数 相 比 ，lambda 函数 可 以 更 清楚 地 表达 程序 员 的 意图 。 
不 过 说 实话 ，lambda 的 应 用 并 不 广泛 ， 至 少 我 在 写 代 码 时 很 少 用 ， 所 以 下 面 再 多 说 几 句 。 
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3.2.2 不 应 过 度 使 用 lambda 


慎 地 使 用 lambda 函数 


二 





O 





若 工作 代码 用 到 了 lambda， 虽 然 看 起 来 很 “ 酷 ” 























虽然 我 希望 本 节能 激发 你 探索 lambda 函数 的 兴趣 ， 但 现在 是 时 候 告 诚 你 ， 


应 该 非常 小 心 谨 











果 想 使 用 lambda 表达 式 ， 那 么 请 花 几 秒 (或 几 分 钟 ) 思考 ， 为 了 获得 你 所 








式 是否 真 的 最 简洁 且 最 易 维护 。 


例如 , 用 下 面 这 种 方式 少 写 两 行 代码 很 春 。 
很 紧 并 且 需 要 快速 修复 bug 的 人 觉得 难以 理解 : 





# 有 害 : 


SSS ere eehes 











， 但 实际 上 对 自己 和 同事 都 是 一 种 负担 。 如 








期 望 的 结果 ， 这 种 方 





[si 








TV tanml ee Sol tm 
eran = aio er el 0 on Mexeremil 


SS ey 
Sm dar oe roenvty 
‘Boom!' 


将 lambda 和 map() 或 filter() 


解析 式 或 生成 器 表达 式 通 常会 清晰 不 少 : 





# 有 害 : 


SES el ee eo be 0) 


上 


# 清晰 : 
>>> 


[O05 2 dr Gp a dO 2 


[CovEor eS nnoe ly 


14 


a 4 





14 


range (16))) 


0] 


虽然 在 技术 上 可 行 且 足 够 花 ? 





肖 ,， 但 会 让 那些 工期 


结合 起 来 构建 复杂 的 表达 式 也 很 难 让 人 理解 ， 此 时 用 列表 





如 果 你 发 现 自己 在 用 lambda 表达 式 做 非常 复杂 的 事 ， 那 么 可 以 考虑 定义 一 个 有 恰当 名 称 的 


独立 函数 。 


从 长 远 来 看 ， 少 融 一 些 代 码 并 不 重要 ， 同 事 ( 以 及 未 来 的 自己 ) 并 不 喜欢 花哨 的 炫 炊 ， 


喜欢 清晰 可 读 的 代码 。 


3.2.3 ”关键 要 点 



































口 lambda 函数 是 单 表 达 式 函数 ， 不 必 与 名 称 绑 定 〈 匿 名 )。 
口 lambda 函数 不 能 使 用 普通 的 Python 语句 ， 其 中 总 是 包含 一 个 隐 式 return 语句 。 
口 使 用 前 总 是 先 问 问 自己 : 使 用 普通 具名 函数 或 者 列表 解析 式 是 否 更 加 清晰 ? 


而 是 








3.3 ” 赤 饰 器 的 力量 


Python 的 装饰 器 可 以 用 来 临时 扩展 和 修改 可 调用 对 象 ( 函数 、 方 法 和 类 ) 的 行为 ,同时 又 不 
会 永久 修改 可 调用 对 象 本 身 。 


装饰 需 的 一 大 用 途 是 将 通用 的 功能 应 用 到 现 有 的 类 或 函数 的 行为 上 ， 这 些 功 能 包括 : 











D 日 志 (logging ) 

D 访问 控制 和 授权 

口 衡量 函数 ， 如 执行 时 间 

口 限制 请 求 速率 ( rate-limiting ) 
口 缓存 ， 等 等 


为 什么 要 掌握 在 Python 中 使 用 装饰 顺 ?” 毕竟 刚刚 提 到 的 内 容 听 起 来 很 抽象 ， 可 能 很 难看 出 
装饰 器 在 日 常 工作 中 能 为 Python 开发 人 员 带 来 的 好 处 。 下 面 我 尝试 通过 一 个 实际 例子 来 回答 这 


个 问题 。 








假设 在 报告 生成 程序 中 有 30 个 处 理 业务 逻辑 的 函数 。 在 一 个 下 着 雨 的 周一 早上 ， 老 板 走 到 
你 的 办 公 桌 前 说 :“ 周 一 快乐 ! 记得 那些 TPS 报告 吗 ? 我 需要 你 为 报告 生成 器 中 的 每 个 步骤 都 添 
加 输入 /输出 日 志 记录 的 功能 ，X 公司 需要 用 其 来 进行 审计 。 对 了 , 我 告诉 他 们 我 们 可 以 在 周三 之 


2 
出 元 o 





如 果 你 对 Python 装饰 器 掌握 得 还 不 错 ， 那 么 就 能 够 冷静 地 应 对 这 个 需求 ， 否 则 就 要 血压 闫 
Fs 


如 果 没 有 装饰 器 ， 那 么 可 能 需要 花费 整整 三 天 时 间 来 逐个 修改 这 30 个 函数 ， 在 其 中 添加 手 
动 调用 日 志 记录 的 代码 。 很 悲惨 吧 ? 
但 如 果 你 了 解 装饰 器 ， 就 能 带 着 微笑 平静 地 对 老板 说 :“ 别 担心 ， 我 会 在 今天 下 午 2 点 之 前 
然后 ， 你 会 着 手 编写 一 个 通用 的 eauait_1log 装饰 器 ( 只 有 大 约 10 行 ), 并 将 其 快速 粘贴 到 
每 个 函数 定义 的 前 面 。 之 后 提交 代码 就 能 休息 了 。 


这 里 我 稍微 压 张 了 一 点 。 不 过 装饰 器 确实 很 强大 。 对 于 所 有 认真 的 Python 程序 员 来 说 ， 理 
解 装饰 器 都 是 一 个 里 程 碑 。 使 用 装饰 器 之 前 ， 需 要 牢固 掌握 Python 中 的 几 个 高 级 概念 ， 包 括 头 
等 函数 的 若干 特性 。 


我 认为 ， 理 解 装饰 器 能 在 Python 工作 中 带 来 巨大 的 收益 。 
当然 , 在 第 一 次 接触 的 时 候 , 你 会 觉得 装饰 需 比 较 复杂 。 然 而 装饰 顺 是 一 个 非常 有 用 的 特性 ， 
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在 第 三 方 框架 和 Python 标准 库 中 会 经 常 遇 到 。 一 个 Python 教程 好 不 好 ， 看 看 其 中 对 装饰 器 的 讲 
解 就 能 知道 了 。 这 里 ， 我 会 竭尽 所 能 逐步 介绍 清楚 。 


日 在 深入 之 前 ， 现 在 最 好 重 温 Python 中 头等 函数 的 特性 。3.1 节 专 门 对 此 进行 了 介绍 ， 你 可 
以 花 点 时 间 来 回顾 一 下 。 对 于 理解 六 饰 屁 来 说 , “头等 函数 ”中 最 重要 的 特性 有 : 


口 函数 是 对 象 ， 可 以 分 配给 变量 并 传递 给 其 他 函数 ， 以 及 从 其 他 函数 返回 ; 
口 在 函数 内 部 也 能 定义 函数 ， 且 子 函 数 可 以 捕获 父 函 数 的 局 部 状态 〈 词法 闭 包 )。 


现在 准备 好 了 吗 ? 下面 就 开始 吧 。 























3.3.1 ”Python 装饰 器 基础 


那么 装饰 器 到 底 是 什么 ?装饰 需 是 用 来 “装饰 ”或 “包装 ” 另 一 个 函数 的 ,在 被 包装 冰 数 运 
行 之 前 和 之 后 执行 一 些 代 码 。 


装饰 器 可 以 用 来 定义 可 重用 的 代码 块 , 改变 或 扩展 其 他 函数 的 行为 ,而 无 须 永 久 性 地 修改 包 
装 函 数 本 身 。 函 数 的 行为 只 有 在 装饰 后 才 会 改变 。 

那么 简单 装饰 器 的 实现 会 是 什么 样子 的 呢 ? 用 基本 术语 来 说 , 装饰 器 是 可 调用 的 ， 将 可 调用 
对 象 作 为 输入 并 返回 另 一 个 可 调用 对 象 。 

下 面 这 个 函数 就 具有 这 种 特性 ， 因 此 可 以 认为 它 是 最 简单 的 装饰 需 : 


GeEnadsconaEcEERTIC 
return func 
































从 中 可 以 看 到 ，null_decorator 是 函数 ， 因 此 是 可 调用 对 和 象 。 它 将 男 一 个 可 调用 对 象 作 
为 输入 ， 但 是 不 做 修改 、 直 接 返回 。 


下 面 用 这 个 函数 装饰 (或 包装 ) 为 一 个 消 数 : 


def greet () : 
return 'Hello!' 











greet = null_ decorator (greet) 


>>> greet() 
WT 


这 个 例子 中 定义 了 一 个 greet 因数 ， 然 后 立即 运行 null1_dqecorator 国 数 来 装饰 它 。 这 个 
例子 看 起 来 没什么 用 ， 因 为 nul11_gdecorator 是 刻意 设计 的 空 装饰 器 。 但 后 面 将 用 这 个 例子 来 
讲解 Python 中 特殊 的 装饰 需 语 法。 


刚刚 是 在 sreet 上 显 式 调 用 nul11_dqecorator, 然 后 重新 分 配给 greet 变量 ,而 使 用 Python 
































的 e 语 法 能 够 更 方便 地 修饰 函数 : 


@null_decorator 
def greet () : 
return 'Hello!' 


>>> greet () 
SEO 全 


在 函数 定义 之 前 放置 一 个 enul1l_dqecorator， 相 当 于 先 定义 函数 然后 运行 这 个 装饰 需 。e 
只 是 语法 糖 ， 简 化 了 这 种 常见 的 写法 。 


注意 ,使 用 e 语 法 会 在 定义 时 就 立即 修饰 该 函数 。 这 样 ， 阁 想 访问 未 装饰 的 原 函数 则 需要 折 
腾 一 番 。 因 此 如 果 想 保留 调用 未 装饰 函数 的 能 力 ， 那 么 还 是 要 手动 装饰 需要 处 理 的 函数 。 
































3.3.2 ”装饰 器 可 以 修改 行为 
在 熟悉 装饰 占 语 法 之 后 ， 下 面 来 编写 一 个 有 实际 作用 的 装饰 右 来 修改 被 装饰 函数 的 行为 。 
这 个 装饰 器 稍微 复杂 一 些 ， 将 被 装饰 函数 返回 的 结果 转换 成 大 写字 母 : 


def uppercase(func) : 
def wrapper () : 
Slo nnn es nt Sire) 
modifieqd result oienmaenl es etsy 
return modifiedqd result 
return wrapper 


这 个 uppercase 装饰 器 不 像 之 前 那样 直接 返回 输入 函数 ， 而 是 在 其 中 定义 一 个 新 函数 ( 闭 
包 )。 在 调用 原 函 数 时 ， 新 图 数 会 包装 原 男 数 来 修改 其 行为 。 

包装 闭 包 ( 新 函数 ) 可 以 访问 未 经 装饰 的 输入 函数 ( 原 函 数 )， 并 且 可 在 调用 输入 函数 之 前 
和 之 后 自由 执行 额外 的 代码 。( 从 技术 上 讲 ， 甚 至 根本 不 需要 调用 输入 函数 。) 

注意 , 到 目前 为 止 被 装饰 的 函数 还 从 未 执行 过 。 实 际 上 , 在 这 里 调用 输入 函数 没有 任何 意义 ， 
因为 装饰 圳 的 目的 是 在 最 终 调用 输入 函数 的 时 候 修改 其 行为 。 



























































你 可 能 需要 一 点 时 间 消 化 一 下 。 装 饰 器 看 起 来 有 点 复杂 ， 但 我 保证 后 续 会 逐步 讲解 清楚 。 
现在 来 看 看 uppercase 装饰 器 的 实际 行为 ， 用 它 来 装饰 原来 的 greet 函数 会 发 生 什么 : 
Guppercase 
def greet(): 


return 'Hello!' 


>>> greet () 
oi 
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和 希望 这 与 你 的 预期 一 致 。 仔 细 看 看 刚刚 发 生 的 事情 吧 。 与 null_dqecorator 不 同 ， 





uppercase 装饰 器 


>>> greet 
<Euneenonerees a0 Les 


>>> null_decorator (greet) 
< Vee me. roel le 0S ES 


>>> uppercase (greet) 


在 装饰 函数 时 会 返回 一 个 不 同 的 函数 对 象 : 


<function uppercase.<locals>.wrapper at 0x76da02f28> 


正如 你 之 前 看 到 的 那样 , 只 有 这 样 装饰 妖 才 能 修改 被 装饰 函数 在 调用 时 的 行为 。 uppe 





LCASG 




















修饰 器 本 身 就 是 一 个 函数 。 对 于 被 装饰 的 输入 函数 来 说 ,修改 其 “未 来 行为 ”的 唯一 方法 是 用 闭 


包 替 换 (或 包装 ) 这 个 输入 函数 。 





这 就 是 为 什么 uppe 
原 输入 函数 并 修改 其 结果 。 











rcase 定义 并 返回 了 男 一 个 函数 ( 财 包 ), 这 个 函数 在 后 续 调 用 时 会 运行 





装饰 器 通过 包装 闭 包 来 修改 可 调用 对 象 的 行为 , 因此 无 须 永久 性 地 修改 原 对 象 。 原 可 调用 对 


象 的 行为 仅 在 装饰 时 才 会 改变 。 





利用 这 种 特性 可 以 将 可 重用 的 代码 块 ( 如 日 志 记 录 和 其 他 功能 ) 应 用 于 现 有 的 函数 和 类 。 








此 装饰 器 是 Python 中 非常 强大 的 功能 ， 


小 种 一 下 








在 标准 库 和 第 三 方 包 中 经 常用 到 。 





顺便 说 一 句 ， 如 果 你 现在 需要 稍微 休息 一 下 ， 完 全 没 问 题 。 在 我 看 来 ， 闭 包 和 装饰 器 位 于 


Python 中 最 难 理解 的 概念 之 列 。 














不 用 着 急 马 上 掌握 这 些 内 容 。 在 解释 需 会 话 中 逐个 尝试 前 面 的 代码 示例 有 助 于 理解 这 些 概 念 。 





我 知道 你 能 做 到 ! 
3.3.3 将 多 个 装饰 器 应 用 于 一 个 函数 





当然 , 多 个 装饰 絮 能 应 用 于 一 个 函数 并 全 加 各 自 的 效果 ,因此 装饰 絮 能 够 以 组 件 的 形式 重复 


使 用 。 


下 面 这 个 例子 中 有 两 个 流 饰 颖 ， 用 于 将 被 浴 饰 函数 返 
结果 中 标签 藤 套 的 方式 能 


deL Ctrong(truney 
def wrapper (): 
et trAno 
return wrapper 





qt EONg 





回 的 字符 串 包 装 在 HTML 标记 中 。 从 


出 Python 应 用 多 个 装饰 器 的 顺序 : 





def emphasis (func): 

def wrapper (): 
return '<em>' + func() + '</em>' 

return wrapper 











现在 把 这 两 个 装饰 器 同时 应 用 到 greet 函数 中 。 可 以 使 用 普通 的 e 语 法 在 函数 前 面 “二 加 ” 
多 个 装饰 需 : 


@strong 
@emphasis 











def greet () : 
elton le 














现在 运行 被 装饰 函数 会 得 到 什么 输出 ? 是 aeemphasis 装饰 器 先 添 加 <em> 标 签 ， 还 是 astrong 
先 添加 <strong> 标 签 ? 来 一 起 看 看 吧 : 





>>> greet () 
'<strong><em>Hello!</em></strong>" 


从 结果 中 能 清楚 地 看 出 装饰 器 应 用 的 顺序 是 从 下 向 上 。 首 先是 aemphasis 装饰 器 包装 输入 
函数 ， 然 后 estrong 装饰 需 重 新 包装 这 个 已 经 装饰 过 的 函数 。 


为 了 帮助 自己 记忆 这 个 从 下 到 上 的 顺序 ， 我 喜欢 称 之 为 装饰 器 栈 "。 栈 从 底部 开始 构建 ， 新 
内 容 都 添加 到 项 部 。 


如 果 将 上 面 的 例子 拆 分 开 来 ， 以 传统 方式 来 应 用 装饰 器 ， 那 么 装饰 器 函数 调用 链 如 下 所 示 : 
decorated_greet = strong (emphasis (greet)) 


同样 , 从 中 可 以 看 到 先 应 用 的 是 smphasis 装饰 带 , 然后 由 strong 装饰 如 重新 包装 前 一 步 
生成 的 包装 函数 。 


这 也 意味 着 堆 受 过 多 的 装饰 器 会 对 性 能 产生 影响 ， 因 为 这 等 同 于 添加 许多 艇 套 的 函数 调用 。 
在 实践 中 这 一 般 不 是 什么 问题 , 但 如 果 在 注重 性 能 的 代码 中 经 常 使 用 装饰 器 ,那么 要 注意 这 一 点 。 
3.3.4 ”装饰 接受 参数 的 函数 

到 目前 为 止 , 所 有 的 例子 都 只 是 装饰 了 简单 的 无 参 函 数 greet ， 没 有 处理 输入 函数 的 参数 。 

之 前 的 装饰 器 无 法 应 用 于 含有 参数 的 函数 。 那 么 如 何 装饰 带 有 参数 的 函数 呢 ? 

这 种 情况 下 ，Python 中 用 于 变 长 参数 的 *args 和 **kwargs 特性 ”就 能 派 上 用 场 了 。 下 面 的 




























































































其 实 称 之 为 “装饰 器 队列 ”更 准确 ， 因 为 最 先 添加 的 装饰 器 最 先 起 作用 ， 而 不 是 最 后 添加 的 起 作用 。 一 一 译 者 注 
@ 参见 3.4 节 。 
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proxy 装饰 器 就 用 到 了 这 些 特性 : 








PT 


Cet Pox UY 
def wrapper (*args, **kwargs): 
I la re | le (sh ew ele 
return wrapper 


这 个 装饰 器 有 两 个 值得 注意 的 地 方 : 





口 它 在 wrapper 闭 包 定义 中 使 用 * 和 ** 操 作 符 收 集 所 有 位 置 参数 和 关键 字 参 数 ， 并 将 其 存 
储 在 变量 args 和 kwargs 中 ; 


口 接着 ，wrapper 闭 包 使 用 * 和 ** “参数 解 包 ” 操 作 符 将 收集 的 参数 转发 到 原 输 入 函数 。 
不 过 星 和 双星 操作 符 有 点 复杂 ， 且 其 具体 含义 与 使 用 环境 有 关 ， 先 明白 这 里 的 含义 就 行 了 。 

















现在 将 proxy 装饰 器 中 介绍 的 技术 扩展 成 更 有 用 的 示例 。 下 面 的 trace 装饰 器 在 执行 时 会 
记录 函数 参数 和 结果 : 
def trace( Eunec) 
def wrapper (*args, **kwargs): 


1 
fu Wane ede (ven 


Cn Ee 


Oe (CE RA EE en (0) 
f'returned {original result!r}') 


"oe en oe eo ns se 
return wrapper 











使 用 trace 对 函数 进行 装饰 后 ， 调 用 该 函数 会 打印 传递 给 装饰 函数 的 参数 及 其 返回 值 。 
仍然 是 一 个 简单 的 演示 示例 ， 不 过 有 助 于 调试 程序 : 


岂 








@trace 
def say (name, line): 
I en nn ln 


>3> Sa ("UAnes. Hello, WoOrld) 

RA CIE GN VO 
‘TRACE: say() returned "Jane: Hello, World”"' 

Mebane als le ool 





说 到 调试 ， 在 调试 装饰 需 时 要 注意 下 面 这 些 事 情 。 





3.3.5 ”如 何 编写 “可 调试 ”的 装饰 器 


在 使 用 装饰 器 时 ， 实 际 上 是 使 用 一 个 函数 替换 另 一 个 函数 。 这 个 过 程 的 一 个 缺点 是 “隐藏 ” 
了 《未 装饰 ) 原 函 数 所 附带 的 一 些 元 数据 。 
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例如 ,包装 闭 包 隐 藏 了 原 函 数 的 名 称 、 文 档 字 符 串 和 参数 列表 : 


def greet () : 
WR UT TON ee 
return 'Hello!" 


decorated_ greet = uppercase (greet) 


如 果 试 图 访问 这 个 函数 的 任何 元 数据 ， 看 到 的 都 是 包装 闭 包 的 元 数据 : 


>>> greet.__name_ _ 

‘greet’' 

>>> greet. doc _ 

‘Return a friendly greeting.’ 








>>> decorated greet.__name 
wrappPer 

>>> decorated greet._ doc _ 
None 


这 增加 了 调试 程序 和 使 用 Python 解释 器 的 难度 。 0 有 一 个 方法 能 避免 这 个 问题 ; 
使 用 Python 标准 库 中 的 functools .wraps 装饰 器 。 


在 自己 的 装饰 器 中 使 用 functools.wraps 能 够 将 丢失 的 元 数据 从 被 装饰 的 函数 复制 到 装 
饰 右 闭 包 中 。 来 看 下 面 这 个 例子 : 


ne te 























def uppercase (fune): 
@functools.wraps (func) 
def wrapper (): 
LOE Tr (ry 
return wrapper 

















将 functools.wraps 应 用 到 由 装饰 妖 返 回 的 封装 闭 包 中 ,会 获得 原 也 数 的 文档 字符 串 和 其 
他 元 数据 : 

Guppercase 

def greet () : 


WT TI TO OPEC 
return 'Hello!! 


>>> greet.__name__ 

‘greet’ 

> crece sdocon 

‘Return a friendly greeting.’ 


建议 最 好 在 自己 编写 的 所 有 装饰 器 中 都 使 用 functools .wraps。 这 并 不 会 占用 太 多 时 间 ， 
同时 可 以 减少 自己 和 其 他 人 的 调试 难度 。 




















| 详 见 Python 文档 :“functools.wraps”。 
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恭喜 你 ， 现 在 已 经 读 完 了 这 复杂 的 一 章 ， 学 习 了 很 多 关于 Python 装饰 咒 的 知识 。 干 得 不 错 ! 


3.3.6 ”关键 要 点 


D 装饰 器 用 于 定义 可 重用 的 组 件 ， 可 以 将 其 应 用 于 可 调用 对 象 以 修改 其 行为 ， 同 时 无 须 永 
入 修改 可 调用 对 象 本 身 。 

口 e 语 法 只 是 在 输入 函数 上 调用 装饰 器 的 简写 。 在 单个 函数 上 应 用 多 个 装饰 器 的 顺序 是 从 底 
部 到 顶部 ( 装饰 器 栈 )。 

口 为 了 方便 调试 ， 最 好 在 自己 的 装饰 器 中 使 用 functools .wraps 将 被 装饰 对 象 中 的 元 数 
据 转移 到 装饰 后 的 对 象 中 。 
口 与 软件 开发 中 的 其 他 工具 一 样 ， 装 饰 器 不 是 万 能 的 ， 不 应 过 度 使 用 。 装 饰 器 虽然 能 完成 
任务 ,但 也 容易 产生 可 怕 且 不 可 维护 的 代码 ， 要 注意 两 者 间 的 取舍 。 



























































3.4 ”有趣 的 x*args 和 **kwargs 


我 曾经 与 一 位 聪明 的 Python 高 手 结对 编程 。 除 了 他 每 次 在 输入 带 有 可 选 或 关键 字 参 数 的 函 
数 时 会 大 喊 “argh” 和 “kwargh”" 之 外 ， 我 们 通常 相处 得 很 好 。 我 猜 ， 人 们 在 学 术 环境 中 编程 
久 了 就 可 能 会 发 生 这 种 情况 。 


尽管 *args 和 **kwargs 参数 不 受 重视 ,但 这 它们 是 Python 中 非常 有 用 的 特性 。 了 解 其 中 
的 潜能 会 让 你 成 为 更 高 效 的 开发 者 。 


*args 和 **kwargs 参数 到 底 有 什么 用 呢 ? 它们 能 让 函数 接受 可 选 参数 , 因此 能 在 模块 和 类 
中 创建 灵活 的 API: 


def foo(required, *args, **kwargs): 
Grn ev ne 
3 ie 
print (args) 
EwWwargs: 
print (kwargs) 









































上 述 函 数 至 少 需要 一 个 名 为 required 的 参数 ， 但 也 可 以 接受 额外 的 位 置 参数 和 关键 字 参 数 。 


如 果 用 额外 的 参数 调用 该 函数 ，args 将 收集 额外 的 位 置 参数 组 成 元 组 ， 因 为 这 个 参数 名 称 
带 有 * 前 级 。 


同样 ，kwargs 会 收集 额外 的 关键 字 参 数 来 组 成 字典 ， 因 为 参数 名 称 带 有 ** 前 级 。 
如 果 不 传 递 额外 的 参数 ， 那 么 args 和 kwargs 都 为 空 。 
































Q@ 这 是 作者 说 的 一 个 笑话 ， 因 为 args 和 argh 很 相似 ，kwargs 和 kwargh 同 理 。 一 一 译 者 注 
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在 用 各 种 参数 组 合 来 调用 这 个 函数 时 ，Python 会 将 位 置 参 数 或 关键 字 参 数 分 别 收集 到 args 
和 kwargs 参数 中 : 


> 
YDeErL Ors 
fo0() MISSING J equired POSTEIioOnal arg: Fedqurredl’" 


> (nee 
hello 


S33 TO el 2、 
hello 
(U2 








> Dll Sh 2 Ke Wale toy 2 

hello 

(lp 

tel valte. yy ey 

这 里 需要 说 清楚 的 是 ， 参 数 args 和 kwargs 只 是 一 个 命名 约定 。 哪 怕 将 其 命名 为 *parms 
和 *x*argv， 前 面 的 例子 也 能 正常 工作 。 实 际 起 作用 的 语法 分 别 是 星 号 (* ) 和 双星 号 ( ** )。 


不 过 还 是 建议 你 坚持 使 用 公认 的 命名 规则 以 避免 混淆 。( 这 样 还 有 机 会 每 隔 一 段 时 间 就 大 喊 
出 “argh” 和 “kwargh”。) 


























3.4.1 传递 可 选 参 数 或 关键 字 参 数 


可 选 参数 或 关键 字 参 数 还 可 以 从 一 个 函数 传递 到 另 一 个 函数 。 这 需要 用 解 包 操作 符 * 和 ** 将 
参数 传递 给 被 调用 的 函数 。" 


参数 在 传递 之 前 还 可 以 修改 ,来 看 下 面 这 个 例子 : 





de Foo{(X Hrgesy RWAaArcey: 
kwargs['name'] = 'Alice' 
new_args = args + ('extra', ) 
ari now Ardgsy WarLdsy 


这 种 技术 适用 于 创建 子 类 和 编写 包装 函数 。 例如 在 扩展 父 类 的 行为 时 , 子 类 中 的 构造 函数 不 
用 再 带 有 完整 的 参数 列表 ， 因 而 适用 于 处 理 那 些 不 受 我 们 控制 的 API: 


ese eon 
etic (cee ecoleor, mMleade: 
Se = elers 
self.mileage = mileage 


























class AlwaysBlueCar (Car): 
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le vanes) 
人 
SCO LO Le 
Ss AlwayapiUueCar(t greem, 48392) COLOF 
'blue" 








AlwaysBlueCar 构造 函数 只 是 将 所 有 参数 传递 给 它 的 父 类 ， 然 后 重 写 一 个 内 部 
函数 会 接受 哪些 参数 。 


全 
味 着 如 果 父 类 的 构造 函数 发 生变 化 ，AlwaysBlueCcar 仍然 可 以 按 预 期 运行 。 
从 知晓 








不 过 缺点 是 ，AlwaysBlueCar 构造 函数 现在 有 一 个 相当 无 用 的 签名 
= 














属性 。 这 意 
若 不 查看 父 类 ， 无 
一 般 情况 下 , 自己 定义 的 类 层次 中 并 不 会 用 到 这 种 技术 。 这 通 
中 的 行为 ， 而 自己 又 无 法 控制 这 些 外 部 类 
但 这 仍然 
叫 出 声 )。 








通常 用 了 














修改 或 覆盖 某 些 外 部 类 
属于 比较 危险 的 领域 , 所 以 最 好 小 心 一 点 (不 然 可 能 很 快 就 会 因为 男 一 个 原因 而 尖 
该 技术 可 能 有 用 的 男 一 个 场景 
所 有 传递 给 包装 函数 的 参数 。 








是 编写 包装 函数 ， 如 装 % 


def trace(f) 


布 融 。 这 种 情况 下 ， 我们 通常 也 想 接受 
如 果 能 在 不 复制 和 粘贴 原 函 数 签名 的 情况 下 就 做 到 这 一 点 ， 就 会 让 代码 更 易于 维护 : 
人 


SO 
result 


def decorated_ function(*args, 
re 


**kwargs) 
kwargs) 
= 
De (ecules) 


**kwargs) 
return decorated function 
@trace 


def greet (greeting, name): 
en Orme name 
>>> greet ('Hello', 


BOlDa) 
bre Moa Monee he (Olt ee 
WHEN DO 


eTEo 





EDOBL 寺 








3.4.2 ”关键 要 点 








这 样 的 技术 使 我 们 有 时 很 难 在 “代码 足够 明确 ”和 “不 要 重复 自己 ”( DRY ) 原则 之 间 保 持 
平衡 。 这 是 个 艰难 的 选择 ， 有 条 件 的 话 建 议 咨询 一 下 同事 的 意见 。 

















口 *args 和 **kwargs 用 于 在 Python 中 编写 变 长 参数 的 函数 。 


口 *args 收集 额外 的 位 置 参 数组 成 元 组 。**kwargs 收集 额外 的 关键 字 参 数组 成 字典 
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口 实际 起 作用 的 语法 是 * 和 **。args 和 kwargs 只 是 约定 俗 成 的 名 称 ( 但 应 该 坚持 使 用 这 
两 个 名 称 )。 
3.5 ” 凶 数 参数 解 包 


* 和 ** 操 作 符 有 一 个 非常 棒 但 有 点 神秘 的 功能 ， 那 就 是 用 来 从 序列 和 字典 中 “ 解 包 ” 函 数 
数 。 
下 面 来 定义 一 个 简单 的 函数 作为 例子 : 


(le One A (Gp a 00) 
OE (a el ee 

















Re 





从 中 可 以 看 到 ， 该 函数 接受 三 个 参数 (x、y 和 z ) 并 美观 地 打印 出 来 。 使 用 这 个 函数 能 在 
程序 中 漂亮 地 打印 三 维 向 量 : 








SS Ten Meal ld), TL, (0) 
全 











如 果 用 其 他 数据 结构 来 表示 三 维 向 量 , 那么 使 用 print_vector 函数 进行 打印 就 会 出 问题 。 
例如 用 元 组 或 列表 表示 三 维 向 量 的 话 ， 在 打印 时 就 必须 明确 指定 每 个 组 件 的 索引 : 


SS Evole Mae SS (Lt, 0, 1) 

en 0 

>>> print_vector (tuple vec[0], 
tuple_vec[1], 
Elevee ll ) 

es 




















使 用 普通 函数 调用 加 上 多 个 参数 既 笨 拙 也 没有 必要 。 如 果 能 够 将 向 量 对 象 “ 炸 开 ”成 三 个 组 
件 ， 一 次 性 将 所 有 内 容 传递 给 print_vector 函数 ， 那 岂 不 是 更 好 ? 



































( 当然 ， 也 可 以 简单 地 重新 定义 print_vector， 让 其 只 接受 一 个 表示 向 量 对 象 的 参数 。 但 
这 里 只 是 要 举 一 个 简单 的 例子 ， 所 以 先 忽略 这 个 方法 。) 


幸好 Python 中 用 * 操 作 符 进行 函数 参数 解 包 能 更 好 地 处 理 这 种 情况 : 


>>> print_ vector(*tuple vec) 
i pk 
(ey 
Sl 





在 函数 调用 时 ， 在 可 迭代 对 象 前 面 放 一 个 * 能 解 包 这 个 参数 ， 将 其 中 的 元 素 作为 单独 的 位 置 
参数 传递 给 被 调用 的 函数 。 


这 种 技术 适用 于 任何 可 迭代 对 象 ， 包括 生成 器 表达 式 。 在 生成 器 上 使 用 * 操 作 符 会 消耗 生成 
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器 中 的 所 有 元 素 ， 并 将 它们 传递 给 函数 : 


EN 
Or voorn( Kneexee) 








* 操 作 符 用 于 将 元 组 、 列 表 和 生成 器 等 序列 解 包 为 位 置 参数 。 除 此 之 外 ， 还 有 用 于 从 字典 中 
解 包 关键 字 参 数 的 ** 操 作 符 。 假 设 用 下 面 这 个 字典 对 象 表示 前 面 的 向 量 : 


Se ee ve lo ts nil i 





那么 可 以 将 该 字典 传递 给 print_vector， 然 后 使 用 ** 操 作 符 解 包 : 


Se vecor (et ee 
Pl 














由 于 字典 是 无 序 的 ， 因 此 解 包 时 会 匹配 字典 键 和 函数 参数 : x 参数 接受 字典 中 与 'x' 键 相关 
联 的 值 。 
如 果 使 用 单个 星 号 (* ) 操作 符 来 解 包 字典 ， 则 所 有 的 键 将 以 随机 顺序 传递 给 函数 : 


ee (le te ey) 
EV 








Python 的 函数 参数 解 包 功 能 带 来 了 很 多 灵活 性 。 也 就 是 说 , 不 一 定 要 为 程序 所 需 的 数据 类 型 
实现 一 个 类 ,使 用 简单 的 内 置 数据 结构 ( 如 元 组 或 列表 ) 就 足够 了 ， 这 样 有 助 于 降低 代码 的 复 


杂 度 。 








关键 要 点 


口 * 和 ** 操 作 符 可 用 于 从 序列 和 字典 中 “ 解 包 ”函数 参数 。 
口 高 效 使 用 参数 解 包 有 助 于 为 模块 和 函数 编写 更 灵活 的 接口 。 

















3.6 ”返回 空 值 


Python 在 所 有 也 数 的 末尾 添加 了 隐 式 的 return None 语句 。 因 此 ， 如 果 函 数 没 有 指定 返回 
值 ， 默 认 情 况 下 会 返回 None。 


这 意味 着 可 以 用 纯 return 语句 替换 return None 语句 ， 也 可 以 直接 不 写 return 语 人 条 3 
结果 完全 相同 : 
def fool (value): 


TE elle 
return value 
































@ 自 Python 3.6 开始 ， 字 上 典 是 有 序 的， 但 仅仅 是 指 择 入 顺序 ， 不 是 某 种 “自动 排序 ”。 一 一 译 者 注 





3.6 返回 空 值 49 





else: 
return None 


def foo2 (value): 
VW Ee 0 al em Monies wn 
Ee 
return value 
else: 
return 


def foo3(value): 
全 全 站 全 人生 区 放生 有 区 ee en Me Wy 
IE ele 
return value 


如 果 向 2 这 三 个 函数 都 传递 假 值 " ， 那 么 三 个 函数 都 能 正常 返回 None: 








> Ev oe 
<class 'NoneType'> 


SS ES ESS270) 
<class 'NoneType'> 


SS "vole 0 ) 
<class 'NoneType'> 


那么 ,什么 情况 下 才 应 该 在 自己 的 Python 代码 中 使 用 这 个 特性 呢 ? 


我 的 经 验 法 则 是 ， 如 果 函 数 (有些 语 言 将 其 称 为 过 程 ) 没有 返回 值 ， 那 么 就 忽略 返回 语句 。 
在 这 种 情况 下 添加 返回 语句 不 仅 多 余 ， 而 且 会 带 来 混乱 。 比 如 Python 的 内 置 print 函数 就 是 一 
个 过 程 , 调用 print 只 是 为 了 使 用 函数 的 副作用 ( 打印 文本 )， 永远 都 不 是 为 了 获得 该 函数 的 返 
回 值 。 

再 来 看 看 Python 内 置 的 sum 函数 。 这 个 函数 显然 具有 一 个 逻辑 返回 值 ， 并 且 通 常 不 会 仅 为 
其 副作用 而 调用 sum。sunm 的 目的 是 将 一 系列 的 数 相 加 ， 然 后 传递 结果 。 因 此 ， 如 采 一 个 函数 从 
逻辑 的 角度 来 看 有 返回 值 ， 那 么 要 自行 决定 是 否 使 用 隐 式 返回 语句 。 

一 方面 , 有 人 认为 省 略 显 式 的 return None 语句 能 让 代码 更 简洁 , 因而 更 易于 阅读 和 理解 。 
主观 上 也 可 以 说 这 让 代码 “更 漂亮 ”了 。 

另 一 方面 ， 有 些 程序 员 很 惊讶 Python 有 这 样 的 行为 。 在 编写 干净 和 可 维护 的 代码 时 ， 出 乎 
意料 的 行为 通常 并 不 是 一 个 好 兆头 。 

例如 在 本 书 的 雏形 中 ， 一 个 代码 示例 使 用 了 “ 隐 式 返回 语句 ”。 代 码 中 没有 对 此 进行 说 明 ， 
本 意 只 是 想 用 一 个 简短 的 代码 示例 解释 Python 中 的 其 他 功能 。 


































































































Oz 布尔 计算 为 False 的 值 。 一 一 译 者 注 
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然而 最 终 我 收 到 了 源源 不 断 的 电子 邮件 ， 向 我 指出 该 代码 示例 中 “缺少 return 请 句 ”"。 显 
然 ， 并 不 是 每 个 人 都 清楚 理解 Python 的 隐 式 返回 行为 ， 而 且 它 在 这 个 示例 中 还 会 令 人 分 心 。 因 
此 我 又 添加 了 一 个 注释 来 说 明 ， 之 后 就 没有 再 收 到 这 些 电子 邮件 了 。 


不 要 误会 , 我 也 喜欢 写 出 干净 且 “ 美 丽 ” 的 代码 。 同 时 , 我 也 强烈 认为 程序 员 应 该 清楚 地 了 
解 正在 使 用 的 语言 中 有 何 细节 。 


不 过 ,考虑 到 即使 这 种 简单 的 误解 对 维护 也 有 很 大 的 影响 , 最 好 写 出 更 明确 清晰 的 代码 ， 毕 
苋 代码 具有 沟通 作用 。 









































关键 要 点 


口 如 果 函 数 没 有 指定 返回 值 ， 则 返回 None。 是 否 明确 地 返回 None 是 风格 方面 的 问题 。 
口 返回 空 值 是 Python 的 核心 功能 ， 但 是 使 用 显 式 的 return None 语句 能 更 清楚 地 表达 代 
码 的 意图 。 
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对 象 比 较 : is 与 == 





当 我 还 是 个 孩子 的 时 候 , 邻居 家 有 一 对 双胞胎 猫 。 这 两 只 猫 看 起 来 完全 相同 ,都 有 炭 黑 色 的 
毛发 和 锐利 的 绿色 眼睛。 除非 依靠 一 些 个 性 上 的 小 兽 好 ,否则 单 从 外 表 无 法 区 分 这 两 只 猫 。 























看 起 来 完全 一 样 ， 但 它们 依然 是 两 只 不 同 的 猫 ， 两 个 不 同 的 生物 。 





这 让 我 意识 到 了 “相等 ”和 “相同 ”两 者 之 间 的 含义 是 有 所 区 别 的 。 这 种 区 别 对 理解 Python 





的 is 和 == 比 较 操 作 符 至 关 重 要 。 











== 操 作 符 比较 的 是 相等 性 ， 即 如 果 那 两 只 猫 是 Python 对 象 ， 那 么 使 用 == 操 作 符 得 到 的 答案 

















下 


“两 只 猫 是 一 样 的 ”。 
然而 is 操作 符 比 较 的 是 相同 性 ， 即 如 果 用 is 操作 符 比 较 那 两 只 猫 ， 则 得 到 的 答案 是 “两 只 























猫 不 是 同一 只 猫 ”。 


在 被 这 些 用 猫 打 的 比方 弄 迷 糊 之 前 ， 我 们 来 看 看 真实 的 Python 代码 。 
首先 ， 创 建 一 个 新 的 列表 对 象 a， 接 着 定义 另 一 个 变量 b 并 指向 相同 的 列表 对 象 : 


Sa 
> 





查看 这 两 个 变量 ， 可 以 发 现 这 两 个 列表 看 上 去 相同 : 


Sa 
[1 
> 
| 





由 于 这 两 个 列表 对 象 看 上 去 相同 ， 因 此 当 使 用 == 操 作 符 比较 时 也 会 获得 期 望 的 结果 : 


> 
Ts 





但 这 个 操作 并 没有 告诉 我 们 a 和 b 是 否 真 的 指向 同一 个 对 象 。 当 然 ， 我 们 知道 是 这 样 的 ， 


尽管 
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因为 之 前 是 我 们 亲自 为 其 赋值 的 。 不 过 假设 我 们 不 知道 ， 那 么 应 该 如 何 检查 呢 ? 
答案 是 用 is 操作 符 比 较 这 两 个 变量 .这 样 就 能 确认 两 个 变量 实际 上 都 指向 同一 个 列表 对 象 : 














SS 
PT 


下 面 来 为 之 前 的 列表 对 象 创建 一 个 完全 相同 的 副本 ， 即 对 已 有 的 列表 调用 1ist () ， 创 建 一 
个 名 为 c 的 副本 : 























SS Xe > J (el) 

同样 ， 新 的 列表 看 上 去 与 a 和 b 指向 的 列表 相同 : 

| 

下 面 就 到 了 有 趣 的 地 方 。 用 -== 操作 符 比 较 列表 副本 = 和 原先 的 列表 a, 你 期 望 看 到 什么 结果 ? 





























好 吧 ， 希望 这 就 是 你 所 期 望 的 结果 。 结 果 显 示 c 和 a 含有 相同 的 内 容 。 因 此 Python 认为 两 
者 是 相等 的 。 但 它们 是 否 指向 同一 个 对 象 呢 ?我 们 用 is 操作 符 验 证 一 下 : 


SS le 
False 


看 ， 这 里 得 到 不 同 的 结果 了 。 虽 然 内 容 相 同 ， 但 Python 告诉 我 们 ，c 和 a 指向 的 是 不 同 的 
对 象 。 


来 概括 一 下 吧 ， 用 两 条 定义 区 分 is 和 == 的 区 别 : 


口 当 两 个 变量 指向 同一 个 对 象 时 ，is 表达 式 的 结果 为 True; 
口 当 各 变量 指向 的 对 象 含有 相同 内 容 时 ，== 表 达 式 的 结果 为 True。 


当 你 需要 在 Python 中 选择 is 和 == 时 ， 只 要 回想 前 面 两 只 猫 的 示例 就 可 以 了 。 你 一 定 没 问 
题 的 。 
4.2 ”字符 串 转 换 〈 每 个 类 都 需要 repr _ ) 


在 Python 中 定义 一 个 自 定义 类 之 后 ， 如 果 尝 试 在 控制 台中 输出 其 实例 或 在 解释 融会 话 中 查 
看 ， 并 不 能 得 到 十 分 令 人 满意 的 结果 。 默 认 的 “转换 成 字符 串 ” 功 能 非常 原始 ， 缺 少 细节 : 
























































Sls (Cene 
See Mm "ee ee 
Ee le eve Aens 
self.mileage = mileage 
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二 Ia 
te (ne 

-eonsolecM Cn ope enaa0s 
Ne 

<_aconsoleMo Te objecte ot 0710%%7 ga05 


默认 情况 下 得 到 的 是 一 个 包含 类 名 和 对 象 实例 id 的 字符 串 〈 这 是 CPython 中 对 象 的 内 存 地 
址 )。 虽然 比 什么 都 没有 要 好 ， 但 也 没什么 用 。 
你 可 能 会 直接 打印 类 的 属性 , 或 者 向 类 中 添加 自 定义 的 to_string () 方 法 来 绕 过 这 个 问题 : 


IE 
(SO 


这 个 总 体 思 路 是 正确 的 ， 但 是 忽略 了 Python 将 对 象 转 成 字符 串 的 约定 和 内 置 机 制 。 
因此 不 要 构建 自己 的 字符 串 转 换 机 制 , 而 是 向 类 中 添加 双 下 划 线 方法 “str 和 repr 。 
这 两 个 方法 以 具有 Python 特色 的 方式 在 不 同情 况 下 将 对 象 转换 为 字符 串 。” 
来 看 看 这 些 方 法 在 实践 中 是 如 何 工 作 的 。 首 先 为 前 面 的 car 类 增加 一 个 str_ 方法 : 
elass SEE3 
def _ init _(self, color, mileage): 


SEO 三 cc 
self.mileage = mileage 
















































































let ta (Se 
elurnt oo CSc Colo oo 


在 尝试 打印 或 查看 car 实例 时 ， 得 到 的 结果 稍 许 有 些 改进 : 


Si a 

> jolie (Om ee ) 

GE 

Sa 

<__Console .Car object at 0x109ca24e0> 


在 控制 台中 查看 car 对 象 得 到 的 依然 是 之 前 包含 对 象 ia 的 结果 , 但 是 打印 对 象 就 会 得 到 由 
新 添加 的 __str ”方法 返回 的 字符 串 。 


_ str_ 是 Python 中 的 一 种 双 下 划 线 方法 ， 尝 试 将 对 象 转换 为 字符 串 时 会 调用 这 个 方法 : 


nt (ns ele) 

areqd ear 

Stn oar 

Ol (ede 

So .Lormat (near) 
“EL JAS TE 














| 详 见 Python 文档 : “The Python Data Model”。 
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有 了 合适 的 _str 实现 , 打印 对 象 时 就 不 用 担心 会 直接 打印 对 象 属性 , 也 不 用 编写 单独 的 
to_string() 图 数 了 。 这 就 是 具有 Python 特色 的 字符 串 转换 方法 。 

顺便 说 一 下 ， 有 些 人 把 Python 的 双 下 划 线 方法 称 为 “魔法 方法 ”。 不 过 这 些 方法 并 没有 什么 
神奇 之 处 ， 以 双 下 划 线 起 始 只 是 一 个 命名 约定 ， 表 示 这 些 方法 是 Python 的 核心 特性 。 除 此 之 外 ， 
加 上 双 下 划 线 还 有 助 于 避免 与 自己 的 方法 和 属性 同名 。 对 象 构造 函数 init_ “就 遵循 这 样 的 约 
定 ， 其 中 并 没有 什么 神奇 或 神秘 的 地 方 。 


因此 不 要 害怕 使 用 Python 双 下 划 线 方法 ， 这 些 方法 大 有 用 途 。 

































































4.2.1 str 与 repr 











我 们 继续 来 看 字符 串 转 换 的 问题 。 前 一 节 中 ， 如 果 在 解释 需 会 话 中 查看 my_car， 仍然 会 得 
到 奇怪 的 <car object in 0x109ca24e0>。 


发 生 这 种 情况 是 因为 在 Python 3 中 实际 上 有 两 个 双 下 划 线 方法 能 够 将 对 象 转换 为 字符 串 。 第 


是 刚刚 介绍 的 __str__; 第 二 个 是 _repr_ ， 其 工作 方式 类 似 于 __str__， 但 用 于 其 他 情 
形 。( Python 2.x 还 有 一 个 unicode_ 方法， 后面 会 介绍 。) 





Pu 








> 














这 里 做 一 个 简单 的 实验 ， 你 可 以 从 中 了 解 _str 和 repr 的 使 用 场景 。 下 面 重新 定义 
car 类 ， 添 加 这 两 个 用 来 转换 成 字符 串 的 双 下 划 线 方法 ， 用 于 产生 不 同 的 输出 : 


eass (Cams 
ee re (el ol me dae) 
Se ONO eo lO 
self.mileage = mileage 








def _ repr__(self): 
returni "Trepp ~ fOr Cary 


Gef Sr (Sel fe 
em St Tol Gols 


芷 尝试 上 面 的 示例 时 ， 可 以 看 到 每 个 方法 生成 了 对 应 的 字符 串 转换 结 


Sd 
(el) 

Sr Fer (C3 

Sp tormat (mn ar) 

WS G0 a 

I 

a 


从 实验 可 以 得 知 ， 在 Python 解释 器 会 话 中 查看 对 象 得 到 的 是 对 象 的 repr。 结果。 


有 趣 的 是 ， 像 列表 和 字典 这 样 的 容器 总 是 使 用 repr_ 的 结果 来 表示 所 包含 的 对 象 ， 哪 怕 
对 容 絮 本 身 调用 str () 也 是 如 此 : 
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SET ean 

Veo J (Ee 

为 了 手动 选择 其 中 一 种 字符 串 转 换 方法 ,比如 要 更 清楚 地 表示 代码 的 意图 , 最 好 使 用 内 置 的 
str() 和 repr() 函数 。 使 用 这 两 个 函数 比 直接 调用 对 象 的 _str_ 或 _ repr_ 要好, 因为 结果 
相同 但 更 美观 : 

ET 

CE Si To OV Ge 

>>> repr (my_car) 

Dr OL Oo 

介绍 完 __str_ _ 和 _ repr_ 之 后 ,你 可 能 想 知 道 它 们 各 自在 实际 使 用 中 的 差异 。 这 两 个 函 
数 的 目的 看 上 去 相同 ， 因 此 你 可 能 对 其 各 自 的 使 用 场景 感到 费解 。 


对 于 这 样 的 问题 ， 可 以 看 看 Python 标准 库 是 怎么 做 的 。 现 在 再 设计 一 个 实验 ， 创 建 一 个 
datetime.date 对 象 ， 看 这 个 对 象 如 何 使 用 _repr 和 ”str 来 控制 字符 串 转换 : 


>>> import datetime 
>>> today = datetime.date.today () 









































在 date 对 象 上 ,。 str 捅 数 的 结果 侧重 于 可 读 性 , 旨 在 为 人 们 返回 一 个 简洁 的 文本 表示 ， 





邮 以 便 放心 地 向 用 户 展示 。 因 此 在 aate 对 象 上 调用 str () 时 , 得 到 的 是 一 些 看 起 来 像 ISO 日 期 格 
电 式 的 东西 : 

sr (eeevy, 

ao 0 








_ repr_ 侧重 的 则 是 得 到 无 歧义 的 结果 ， 生 成 的 字符 串 更 多 的 是 帮助 开发 人 员 调 试 程序 。 
为 此 需要 尽 可 能 明确 地 说 明 这 个 对 象 是 什么 ， 因 此 在 对 象 上 调用 repr () 会 得 到 相对 更 复杂 的 结 
果 ， 其 中 甚至 包括 完整 的 模块 和 类 名 称 : 


>>> repr (today) 
vaaeee lime ose 2 


复制 并 粘贴 由 这 个 repr 返回 的 字符 串 ， 可 以 作为 有 效 的 Python 语句 重新 创建 原 date 
对 象 。 这 种 方式 很 不 错 ， 在 编写 自己 的 repr 时 值得 借鉴 。 

然而 我 发 现 这 个 模式 实践 起 来 相当 困难 ,通常 不 值得 这 么 做 ， 因 为 这 只 会 带 来 额外 的 工作 。 
我 的 经 验 法 则 是 只 要 让 __repr_ 生成 的 字符 串 对 开发 人 员 清 晰 且 有 帮助 就 可 以 了 ， 并 不 需要 能 
从 中 恢复 对 象 的 完整 状态 。 












































4.2.2 ”为 什么 每 个 类 都 需要 repr 


如 有 果 不 提供 ”str_ 方法 ，Python 在 查找 ”str 时 会 回 退 到 repr 的 结果 。 因 此 建议 
总 是 为 自 定 义 类 添加 repr 方法 ,这 只 需 花 费 很 少 的 时 间 ， 但 能 保证 在 几乎 所 有 情况 下 都 能 
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得 到 可 用 字符 串 转换 结果 。 
下 面 介 绍 如何 快 速 高 效 地 为 自 定义 类 添加 基本 的 字符 串 转换 功能 。 对 于 前 面 的 car 类 , 首 
先 添加 一 个 _repr__: 


def _ repr__(self): 
ee EO (Se On I 


注意 ,这 里 使 用 !r 转换 标志 来 确保 输出 字符 串 使 用 的 是 repr (self .color) 和 repr (self. 
mileage), 而 不 是 str (self .color) 和 str(self.mileage)。 


虽然 这 样 能 正常 工作 , 但 缺点 是 在 格式 字符 串 中 硬 编 码 了 类 名 称 。 有 一 种 技巧 能 避免 这 种 硬 
编码 ， 即 使 用 对 和 象 的 _ class__.__name 属性 来 获得 以 字符 串 表 示 的 类 名 称 。 


这 样 做 的 好 处 是 在 改变 类 名 称 时 ， 不 必修 改 _、repr__ 的 实现 ， 因 此 能 更 好 地 遵循 “不 要 重 
复 自己 ”(DRY ) 原则 : 










































































def _ repr__(self): 
eluent ESelte oases ?7 name 
Ee Cre ed ee ns ey) 


其 缺点 是 格式 字符 串 非 常 长 旦 笨拙 。 但 如 果 仔 细 设 置 格式 , 依然 能 保持 良好 的 代码 形式 ,并 
符合 PEP 8 规范 。 
有 了 上 面 的 _repr 实现， 在 直接 查看 对 象 或 调用 repr () 时 能 够 得 到 有 用 的 结 


>>> repr (my_car) 
ER 


打印 对 象 或 调用 str() 会 返回 相同 的 字符 串 ， 因 为 默认 的 __str 实现 只 是 简单 地 调用 


— repr_: 





























nn 
"Oe ee ae 
> 

(Ce 


我 认为 这 是 一 种 标准 方法 ,能 做 到 事半功倍 ， 并 且 在 大 部 分 情况 下 可 以 直接 使 用 。 因 此 , 我 
总 是 会 为 自 定义 类 添加 一 个 基本 的 __repr_ 实现 。 


下 面 是 一 个 针对 Python 3 的 完整 示例 ， 其 中 还 包括 可 选 的 _ str 实现 : 























cea: 
cor et (Serf Color. nyeage)s: 
SEE Ge GO 人生 三 二 Ce 人 
self.mileage = mileage 


der 二 二 大 全 BT (总 全 于 下放 二 


4.2 ”字符 串 转换 (每 个 类 都 需要 repr ) 57 





reeurne (ft (Selt Velasse nomes 
JE tl reroll ed ne lp Mave ne rere ne a) 





def _ str (self): 
ot ol eC role /eee 


4.2.3 Python 2.x 的 差异 : unicode 

在 Python 3 中 使 用 str 数据 类 型 表示 文本 ,其 中 用 到 了 unicode 字符， 可 以 表示 世界 上 大 部 
分 书写 系统 。 

Python 2x 使 用 不 同 的 数据 模型 来 表示 字符 串 。" 有 两 种 类 型 可 以 表示 文本 : str ( 仅 限 于 
ASCII 字 符 集 ) 和 unicode (等 同 于 Python 3 的 str) 


由 于 这 种 差异 ，Python 2 中 还 有 另 一 种 双 下 划 线 方法 能 够 控制 字符 串 转换 : _ unicode __。 
在 Python2 中 ， str 返回 字 节 ， 而 _ unicode ”返回 字符 。 


大 多 数 情况 下 应 优先 使 用 新 的 _unicoae ， 方 法 转换 字符 串 。 同 时 还 有 一 个 内 置 的 
unicode () 困 数 ， 该 郴 数 会 调用 相应 的 双 下 划 线 方法 ,与 str () 和 tepr() 的 工作 方式 相似 。 

到 目前 为 止 还 不 错 , 但 Python 2 中 调用 ”str 和 ”unicode ”的 规则 非常 古怪 : print 
语句 和 str() 调 用 str ; 内 置 的 unicode() 先 调用 unicode ， 若 没有 _unicode 
则 回 退 到 __str _， 此 时 使 用 系统 文本 编码 对 结果 进行 解码 。 

与 Python 3 相 比 , 这些 特殊 情况 让 文本 转换 规则 变 得 更 加 复杂 。 不 过 能 针对 实际 情况 进一步 
简化 。unicode 是 Python 程序 中 处 理 文 本 的 首选 ， 同 时 也 是 趋势 。 


所 以 一 般 情 况 下 ， 建 议 在 Python 2.x 中 将 所 有 字符 串 格 式 化 代码 放 和 unicoae ”方法 中 ， 
然后 创建 一 个 _str_ 存根 实现 ， 返 回 以 UTF-8 编码 的 unicode 表示 形式 : 












































def __ str (self): 
return unicode(self) .encode('utf-8') 


大 多 数 自 定义 类 中 的 _str_ 存根 函数 都 是 相同 的 , 所 以 可 以 根据 需要 复制 和 粘贴 (或 者 放 
到 一 个 基 类 中 )。 所 有 生成 针对 非 开发 人 员 的 字符 串 转 换代 码 都 应 位 于 _unicodqe 中 。 


下 面 是 一 个 针对 Python 2.x 的 完整 示例 : 


class Car (object): 
def mnie (Sel J eolor, mleade).: 
SEOLEGi eo 
self.mileage = mileage 











def _ repr,__(self): 





| 详 见 Python 2 文档 :“Data Model”。 
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的 
(lee oie re se 


name 





Se olor mR laa 
def _ unicode (self): 
I 1 ei Eee) ene 


Gar .Tormatt Seltf=BelEf) 


Gef >。 Sceream(SeLrt rs: 


return unicode(self) .encode('utf-8') 














4.2.4 ”关键 要 点 
口 使 用 str _ 和 __repr 
口 _ str _ 的 结果 应 该 是 可 读 的 。 repr 














双 下 划 线 方法 能 够 自行 控制 类 中 的 字符 串 转 换 。 


的 结果 应 该 是 无 歧义 的 。 











口 总 是 为 类 添加 ”repr  。 str 




















而 不 是 


默认 情况 下 会 调用 _repr_。 





Str oo 





口 在 Python 2 中 使 用 unicogde 


4.3 ”定义 自己 的 异常 类 


> 














在 刚 开始 使 用 Python 时 ， 我 不 敢 在 代码 中 编 错 
很 多 好 处 ， 比 如 可 以 清楚 地 显示 出 潜在 的 错误 ,让 函数 和 模块 更 具 可 维护 性 。 自 定义 错误 





可 用 来 提供 额外 的 调试 信息 。 











写 自 定义 异常 类 。 但 是 定义 自己 的 错误 





类 型 有 
类 型 还 














这 些 特性 都 有 助 于 改进 Python 代码 ， 使 其 更 易于 理解 、 调 试 和 维护 。 下 面 通过 几 个 例子 循 
序 渐进 地 轻松 学 习 定 义 自 己 的 异常 类 。 本 节 将 逐个 介绍 其 中 必须 掌握 的 要 点 。 


假设 需要 对 应 用 程序 中 表示 人 名 的 输入 字符 串 进 行 验证 , 你 编写 了 下 面 这 个 简单 的 人 名 验证 











函数 : 


def validate (name): 
(Os: 
raise ValueError 
































如 果 函 数 验证 失败 就 会 引发 ValueError 异常 。 这 看 上 去 已 经 很 有 Python 特色 了 ， 还 算 可 





以 吧 。 




















不 过 使 用 像 valueError 这 样 的 “高 级 ” 泛 型 异常 类 有 一 个 缺点 。 假 设 函 数 是 其 他 库 的 一 
部 分 ,同事 在 不 了 解 其 内 部 实现 的 情况 下 直接 使 用 。 那 么 在 名 字 验 证 失败 时 ,， 栈 调试 回溯 中 的 内 








eh 








容 会 如 下 所 示 : 
volaeen( le) 
Traceback (most recent call last): 
EAN Le moles 
validate('joe') 
ln noe ne elles 


raise ValueError 
ValueError 
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这 个 栈 回溯 用 处 不 大 。 虽然 知道 出 了 问题 ,并 且 问 题 与 某 种 “错误 的 值 ”有 关 , 但 为 了 解决 
问题 ， 同 事 肯定 会 查看 valiaate () 的 实现 。 但 阅读 代码 需要 时 间 ， 而 且 通 常会 耗费 很 长 时 间 。 

幸运 的 是 还 有 更 好 的 办 法 , 即 引 入 自 定义 异常 类 型 来 表示 名 字 验 证 失败 。 下 面 将 基于 Python 
的 内 置 ValueError 创建 新 的 异常 类 ， 但 用 更 显 式 的 名 称 来 说 明 问题 : 























Class NameTooShortError (ValueError): 
pass 


def validate (name): 
1 ailnemsey a TO03 
raise NameTooShortError (name) 





现在 有 了 能 够 “顾名思义 ”的 NameTooShortError 异常 类 型 , 它 扩 展 自 内 置 的 ValueError 
类 ,一 般 情况 下 自 定义 异常 都 是 派生 自 Exception 这 个 异常 基 类 或 其 他 内 置 的 Python 异常 如 
取决 于 哪个 更 合适 。 


另外 , 注意 在 valigdate 函数 中 实例 化 自 定 义 异 党 时 , 将 name 变量 传递 给 了 构造 函数 ， 这 
样 能 为 他 人 提供 更 好 的 栈 回 溯 内 容 : 
>>> validate('jane') 
Tracebaek (most recent call last): 
Ee le 
validate('jane') 
I i Voiele 
raise NameTooShortError (name) 
NameTooShortError: jane 


再 次 尝试 从 他 人 的 角度 体会 一 下 上 面 的 输出 。 当 发 生 错误 时 , 自 定义 异常 类 能 清楚 地 描述 发 
生 的 状况 。 

即使 是 在 自己 的 代码 库 上 工作 也 是 如 此 ， 结 构 良 好 的 代码 在 数 周 或 数 月 之 后 依然 很 容易 维护 。 

花费 30 秒 定义 一 个 简单 的 异常 类 就 能 让 代码 更 加 可 读 。 现 在 继续 前 进 ， 还 有 更 多 内 容 需 要 
掌握 [2 

无 论 是 公开 发 布 Python 软件 包 ， 还 是 为 公司 创建 可 重用 的 模块 ， 最 好 为 模块 创建 一 个 自 定 
义 异常 基 类 ， 然 后 从 中 派生 所 有 其 他 异常 。 

下 面 为 一 个 模块 或 包 中 的 所 有 异常 创建 自 定义 的 异常 层次 结构 。 第 一 步 是 声明 一 个 基 类 , 其 
他 所 有 的 具体 错误 都 会 继承 这 个 类 : 


el le EVV ol Ve ea en oh (We eo 
pass 


所 有 的 “实际 ”错误 类 都 可 以 从 这 个 错误 基 类 派生 出 来 ,从 而 组 成 一 个 优雅 且 整 洁 的 异常 层 












































ValueError 或 TypeError 
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Class NameTooShortError (BaseValidationError): 
pass 


class NameTooLongError (BaseValidationError): 
pass 


class NameTooCuteError (BaseValidationError): 
pass 


这 样 用 户 就 可 以 编写 try . . .except 语句 来 处 理 软 件 包 中 所 有 的 自 定义 错误 ， 无 须 手 动 捕 
获 各 个 具体 的 异常 : 
Cry 
validate (name) 


except BaseValidationError as err: 
handle validation error (err) 


用 户 仍 然 可 以 捕获 更 具体 的 异常 , 不 过 如 果 想 以 宽泛 的 方式 处 理 , 那么 可 以 捕获 这 个 自 定义 
基 类 , 不 用 再 一 股 脑 地 捕获 所 有 异常 了 。 捕 获 所 有 异常 通常 是 一 种 反 模式 , 会 默默 否 下 并 隐藏 无 
关 的 错误 ， 让 程序 难以 调试 。 

当然 ,还 可 以 进一步 扩展 这 种 思想 , 将 异常 根据 逻辑 分 组 ,形成 更 精细 的 子 层次 结构 。 但 要 
小 心 ， 这 样 很 容易 引入 不 必要 的 复杂 性 。 

总 之 , 编写 自 定义 异常 类 能 更 好 地 在 代码 中 采纳 “请 求 原谅 比 请 求 许可 更 容易 ”( easier to ask 
for forgiveness than permission，EAFP ) 这 种 Python 式 的 编程 风格 。 











































































































关键 要 点 

口 定义 自己 的 异常 类 型 能 让 代码 清楚 地 表达 出 自己 的 意图 ， 并 易于 调试 。 

口 要 从 Python 内 置 的 Exception 类 或 特定 的 异常 类 (如 ValueError 或 KeyError ) 派 
生出 自 定义 异常 。 

口 可 以 使 用 继承 来 根据 逻辑 对 异常 分 组 ， 组 成 层次 结构 。 


4.4 克隆 对 象 


Python 中 的 赋值 语句 不 会 创建 对 象 的 副本 ,而 只 是 将 名 称 绑 定 到 对 象 上 。 对 于 不 可 变 对 象 也 
是 如 此 。 

但 为 了 处 理 可 变 对 象 或 可 变 对 象 集合 ， 需 要 一 种 方法 来 创建 这 些 对 象 的 “真实 副本 ”或 “ 克 
隆 体 ”。 


从 本 质 上 讲 , 你 有 时 需要 用 到 对 象 的 副本 ,以 便 修改 副本 时 不 会 改动 本 体 。 本 节 将 介绍 如 何 
在 Python 中 复制 或 “克隆 ”对 象 ， 以 及 相关 的 注意 事项 。 
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先 来 看 如 何 复制 Python 的 内 置 容器 ( collection )。"Python 的 内 置 可 变 容 器 ， 如 列表 、 字 典 
和 集合 ， 调 用 对 应 的 工厂 函数 就 能 完成 复制 : 














iS vl (lt 
em ee SY oe (ene ee volede ) 
new_set = set (original_ set) 


但 用 这 种 方法 无 法 复制 自 定 义 对 象 ， 且 最 重要 的 是 这 种 方法 只 创建 浅 副 本 。 对 于 像 列表 、 
典 和 和 集合 这 样 的 复合 对 象 ， 浅 复制 和 深 复 制 之 间 有 下 面 这 一 个 重要 区 别 。 


浅 复制 是 指 构建 一 个 新 的 容 吉 对象, 然后 填充 原 对 象 中 子 对 象 的 引用 。 本 质 上 浅 复 制 只 执行 
一 层 ， 复 制 过 程 不 会 递归 ， 因 此 不 会 创建 子 对 象 的 副本 。 


深 复制 是 递归 复制 , 首先 构造 一 个 新 的 容 需 对 象 , 然后 递归 地 填充 原始 对 象 中 子 对 象 的 副本 。 
这 种 方式 会 遍历 整个 对 象 树 ， 以 此 来 创建 原 对 象 及 其 所 有 子 项 的 完全 独立 的 副本 。 


这 里 的 内 容 有 点 多 ， 所 以 我 们 会 通过 一 些 例子 来 理解 深 复制 和 浅 复 制 之 间 的 区 别 。 
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4.4.1 制作 浅 副 本 
下 面 的 例子 中 将 创建 一 个 新 的 嵌 套 列表 ， 然 后 用 1ist () 工厂 函数 浅 复制 : 





SN | a Se HO pe lp dp eld 
>>> ys = list (xs) # 制作 一 个 浅 副 本 


这 意味 着 ys 现在 是 一 个 新 的 独立 对 象 , 与 xs 具有 相同 的 内 容 。 查 看 这 两 个 对 象 来 确认 一 下 




















为 了 确认 ys 真 的 与 原 对 象 互相 独立 ,我 们 来 设计 一 个 小 实验 。 先 尝试 向 原 对 象 ( xs ) 添加 
一 个 新 列表 ， 然 后 查看 这 个 改动 是 否 影响 了 副本 ( ys ): 


>> xs.append(['new sublist']) 





这 
闫 
ew SueleSt 可 
> 
[ 





从 中 可 以 看 到 ， 结 果 符合 预期 。 修 改 浅 复制 的 列表 完全 不 会 影响 副本 。 
但 由 于 前 面 只 创建 了 原 列 表 的 浅 副 本 ， 所 以 ys 仍然 含有 xs 子 对 象 的 引用 。 











Q@ 此 处 把 collection 翻译 成 了 “容器 ”以 便 与 中 文 语 境 下 的 “集合 ”( set ) 做 区 分 。 下 文 在 介绍 namedtuple“ 容 器 ” 
类 型 时 ， 使 用 的 是 container 一 词 。 




















62 第 4 章 类 与 面向 对 象 








这 些 子 对 象 没有 复制 ， 只 是 在 ys 中 




















再 次 引用 。 


因此 在 修改 xs 中 的 子 对 象 时 ， 这 些 改动 也 会 反映 在 ys 中 一 一 因为 两 个 列表 共享 相同 的 子 


对 象 。 这 个 副本 是 仅 含 有 一 层 的 浅 复 制 : 





Od 

XS 

EI ed De (SS I 2 
SS>%VSs 

Be 1 So dn 




















pa [er wn te 


在 上 面 的 例子 中 ， 看 上 去 只 是 修改 了 xs。 但 事实 证 明 ，xs 和 ys 中 的 索引 1 处 的 子 列表 都 
被 修改 了 。 再 次 提醒 ， 发 生 这 种 情况 是 因为 前 面具 创建 了 原始 列表 的 浅 副本 。 


如 果 在 第 一 步 中 创建 的 是 xs 的 深 副 本 ， 那 么 这 两 个 对 象 会 互相 完全 独立 。 这 就 是 对 象 的 浅 





























副本 和 深 副 本 之 间 的 实际 区 别 。 





剩 下 的 问题 如 下 。 
口 如 何 创建 内 置 容器 的 深 副 本 ? 

















意 Python 对 象 的 浅 副 本 和 深 副 本 。 


4.4.2 ”制作 深 副 本 





























现在 你 了 解 了 如 何 创建 一 些 内 置 容 需 类 的 浅 副 本 ， 并 且 知 道 了 浅 复 制 和 深 复 制 之 间 的 区 别 ， 








口 如 何 创 建 任意 对 象 ( 包括 自 定 义 类 ) 的 浅 副 本 和 深 副 本 ? 
解决 这 些 问 题 需要 用 到 Python 标准 库 中 的 copy 模块 。 该 模块 提供 了 一 个 简单 接口 来 创建 任 








修改 前 面 的 列表 复制 示例 ， 这 次 使 用 copy 模块 中 定义 的 deepcopy () 函数 创建 深 副 本 : 


En oreyeory 
2 
>>> 2ZS = COpy.deepcopy (xs) 


在 查看 xs 及 使 用 copy .deepcopy ( 
起 来 都 一 样 : 


>>> XS 
alot | (Ss (ee ed 
>>28 
[| hl I Me Sr Ale 








[7， 





8 


) 创建 的 副本 zs 时 , 会 发 现 和 前 面 的 示例 相同 , 它们 看 


但 如 果 修 改 原 对 象 ( xs ) 中 的 某 个 子 对 象 ， 则 会 发 现 这 些 修改 不 会 影响 深 副 本 ( zs )。 
现在 原 对 象 和 副本 是 完全 独立 的 。 复制 过 程 中 递归 复制 了 xs， 包 括 它 的 所 有 子 对 象 
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信用 全 
> 


你 可 能 需要 打开 Python 解释 器 ， 花 一 些 时 间 熟 悉 这 些 例子 。 在 亲 
地 理解 这 些 对 象 复制 的 概念 。 











对 象 的 浅 副 本 。 

















尝试 这 些 例子 后 能 更 好 


顺便 说 一 句 , 还 可 以 使 用 copy 模块 中 的 一 个 函数 来 创建 浅 副 本 。copy .copy () 函数 会 创建 


在 代码 中 ，copy .copy () 可 以 清楚 地 表明 这 里 创建 的 是 浅 副 本 。 但 对 于 内 置 容器 ， 只 需要 








使 用 1ist、Gict 和 set 这 样 的 工厂 函数 就 能 创建 浅 副 本 ， 这 种 方式 更 具 





4.4.3 复制 任意 对 象 


还 有 一 个 问题 是 ， 如 何 创建 任意 对 象 ( 包括 自 定义 类 ) 的 浅 副 本 和 深 吕 





Python 特色 。 


上 本 ， 下 面 就 来 看 看 。 





还 是 要 用 到 copy 模块, 其 中 的 copy .copy () 和 copy .deepcopy () 函数 可 以 复制 任何 对 象 。 
同样 ， 理 解 其 工作 方式 的 最 好 方法 是 进行 简单 的 实验 。 基 于 之 前 的 列表 复制 示例 ,首先 定义 














一 个 简单 的 2D 点 类 : 


IE 
ET 
SEL 
SO 


def __ repr__(self): 
etn pon ee el 


这 个 类 很 简单 ， 其 中 实现 了 __repr__() 以 便 轻松 地 在 Python 解释 器 


接 下 来 将 创建 一 个 Point 实例 ， 然 后 使 用 copy 模块 进行 浅 复 制 : 


SS ne (ce 2) 
SS So Coo /ay) 








如 果 查 看 原 Point 对 象 及 其 浅 副 本 的 内 容 ， 会 发 现 正 如 期 望 中 的 一 样 : 





Sa 
Ee 
人 
eee (2 
ts 
False 





中 查看 从 此 类 创建 的 
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还 有 一 点 需要 记 住 , 由 于 的 点 对 象 使 用 不 可 变 类 型 ( int ) 作为 其 坐标 , 因此 在 这 种 情况 下 ， 
浅 复制 和 深 复制 之 间 并 没有 区 别 。 不 过 下 面 会 扩展 这 个 例子 。 


来 看 一 个 更 复杂 的 例子 。 下 面 将 定义 另 一 个 类 来 表示 2D 和 矩形。 这 次 将 创建 更 复杂 的 对 象 层 
欠 结 构 ， 和 矩形 将 使 用 Point 对 象 来 表示 坐标 : 


class Rectangle: 
ele an (lt OO tl tn te 
selit omerter es omesrt 
Sani ol om ee lo las om 

















def _ _ repr__(self): 
return (f'Rectangle({self.topleft!r}, 
Ed Jee OA Oe ey 


同样 ， 首 先 尝试 创建 一 个 矩形 实例 的 浅 副 本 : 


ee de nol ee i re ta ye) 
orect = CoO Copr(rEercty 


如 果 碍 看 原 矩 形 及 其 副本 , 会 看 到 repr _() 对 Point 也 能 正常 重 载 , 并 且 浅 复制 过 程 正 
常 工作 : 








Sh TOCt 

Rectangle (leornet0 1 Pomes 0) 
人 

Receanone (Ponmme( oN Pomese 6 
SES ele en uel 

False 


还 记得 前 面 关于 列表 的 示例 中 是 如 何 查 看 浅 副 本 和 深 副 本 之 间 的 区 别 吗 ?这 里 将 使 用 相同 
的 方法 ， 在 对 象 层 次 结构 中 修改 位 于 内 部 的 对 象 ， 然 后 在 〈 浅 ) 副本 中 查看 相关 改动 : 


So re bt 9 

SOCt 

Rectangle(Point(999, 1), Point(5, 6)) 
>>> Srect 

Rectmanone (eorme(to os ons. 


望 这 和 你 的 期 望 一 致 。 接 着 将 创建 原 矩 形 的 次 副本 并 再 次 修改 ， 观 察 哪些 对 象 受到 影响 : 


>>> drect = copy.deepcopy (srect) 

> OC te 

>>> drect 

RecEeancole (ponme( 2 1 Porme(s. en 
> 

Rectangler( pone(tr 0 Pornmeesa ne 
ee 

Rectangle(Point(999,. 1), point (5, 6)) 


看 吧 ! 这 次 深 副本 ( drect ) 完全 独立 于 原 对 象 (rect ) 和 浅 副 本 ( srect )。 
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到 这 里 已 经 介绍 了 很 多 内 容 ， 但 关于 对 象 的 复制 还 有 许多 细节 。 


这 个 主题 值得 深入 研究 ， 因 此 你 可 能 需要 研究 copy 模块 的 文档 "， 甚 至 可 能 需要 深入 研究 
copy 模块 的 源码 ”。 例 如 ， 对 象 可 以 通过 定义 特殊 方法 _copy__() 和 ”deepcopy__() 来 控制 
它们 的 复制 方式 。 玩 得 开心 ! 











4.4.4 ”关键 要 点 

口 创建 的 浅 副 本 不 会 克隆 子 对 象 ， 因 此 副本 和 原 对 象 并 不 完全 独立 。 

口 对 象 的 深 副 本 将 递归 克隆 子 对 象 。 副 本 完全 独立 于 原 对 象 ， 但 创建 深 副 本 的 速度 较 慢 。 
口 使 用 copy 模块 可 以 复制 任意 对 象 (包括 自 定义 类 )。 




















4.5 用 抽象 基 类 避免 继承 错误 


抽象 基 类 ( abstract base class，ABC ) 用 来 确保 派生 类 实现 了 基 类 中 的 特定 方法 。 本 市 将 学 
习 其 优点 以 及 如 何 使 用 Python 内 置 的 abc 模块 来 定义 抽象 基 类 。 


那么 抽象 基 类 适用 于 哪些 地 方 呢 ? 前 一 段 时 间 ， 我 跟 同事 讨论 了 在 Python 中 哪 种 模式 适合 
用 来 实现 可 维护 的 类 层次 结构 。 具 体 来 说 , 就 是 想 以 方便 程序 员 且 可 维护 的 方式 为 服务 端 定 义 简 
单 的 类 层次 结构 。 

我 们 有 一 个 Baseservice 类 定义 了 一 个 通用 接口 和 几 个 具体 的 实现 。 这 些 具体 的 实现 
(MockService 和 RealService 等 ) 各 自 做 不 同 的 事情 , 但 都 提供 了 相同 的 接口 。 明 确 一 下 这 
种 关系 : 所 有 这 些 具体 实现 都 是 Baseservice 的 子 类 。 

为 了 使 这 些 代 码 尽 可 能 易于 维护 和 方便 程序 员 使 用 ， 我 们 和 希望 确保 以 下 几 点 : 


D 无 法 实例 化 基 类 ; 
口 如 果 忘 记 在 其 中 一 个 子 类 中 实现 接口 方法 ， 那 么 要 尽早 报错 。 


什么 要 使 用 Python 的 abc 模块 来 解决 这 个 问题 ?上 述 设计 在 复杂 的 系统 中 很 常见 ， 为 了 强 
制 派生 类 实现 基 类 中 的 许多 方法 ， 通 常 使 用 如 下 Python 惯用 法 : 
Glass pase: 


def fool(self): 
raise NotImplementedError() 













































































def bar (self): 
raise NotImplementedError!() 








人 详 见 Python 文档 : “Shallow and deep copy operations”。 
@) 详 见 CPython 源码:“Lib/copy.py”。 
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class Concretel(Base): 
def foo(self) : 
melurne ioo(M calmkee 


# 忘记 重 载 bar () 了 ……: 
| GBs Bar (seLE)s 
# Ot rt) a 





第 一 次 尝试 解决 问题 时 , 会 发 现在 Base 的 实例 上 调用 方法 能 正确 引发 Not ImplementedError 


已 A 
天 吊 


会 引 


abc 


>> Rasey 
> oy 
NotImplementedError 


此 外 ，Concrete 类 也 能 正确 地 实例 化 和 使 用 。 如 果 在 其 实例 上 调用 未 实现 的 方法 bar () 也 
发 异常 : 

OnicasEEe 全 

Siocon 

OOW ND OOM 


> moos 
NotImplementedError 


第 一 个 实现 还 不 错 ， 但 不 够 完美 ， 有 以 下 缺点 可 以 改进 : 


口 实例 化 Base 时 没有 报错 ; 

口 提供 了 不 完整 的 子 类 ， 即 实例 化 concrete 并 不 会 报错 ， 只 有 在 调用 缺失 的 bar () 方 法 
时 才 报 错 。 

使 用 自 Python 2.6 添加 的 abc 模块 ?可 以 更 好 地 解决 剩 下 的 这 些 问 题 。 下 面 这 个 改进 版 使 用 

模块 定义 了 抽象 基 类 . 


from abc import ABCMeta, abstractmethod 





class Base (metaclass=ABCMeta): 
@abstractmethod 
def fool(self): 
pass 


@abstractmethod 
def bar (self): 
pass 





Glass Concretel(Base): 
def fool(self): 
pass 


# 又 忘记 声明 bar() 了 ……: 





人 详 见 Python 文档 :“abc module”。 
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这 种 方式 仍然 能 按 预 期 运行 并 正确 地 创建 类 层次 结构 : 


assert issubclass (Concrete, Base) 


这 么 做 有 额外 的 好 处 。 如 果 忘 记 实 现 某 个 抽象 方法 ， 实 例 化 Base 的 子 类 时 会 引发 
TypeError。 引 发 的 异常 会 告诉 我 们 缺少 哪些 方法 : 








二 OneieEs 人 

TypeError: 

"Can't instantiate abstract class Concrete 
with abstract methods bar”" 


不 用 abc 模块 的 话 , 如 果 缺 失 某 个 方法 , 则 只 有 在 实际 调用 这 个 方法 时 才 会 抛 出 Not Imple- 
mentedError。 在 实例 化 时 就 告知 缺少 某 个 方法 的 好 处 很 多 ， 这 样 更 难 编写 出 无 效 的 子 类 。 如 
果 你 正在 编写 新 的 代码 可 能 还 体会 不 到 ， 但 几 周 或 几 个 月 后 就 会 感觉 到 这 个 优点 了 。 

当然 ， 这 种 模式 并 不 能 完全 替代 编译 时 的 类 型 检查 , 但 能 使 类 层次 更 稳健 且 易 于 维护 。 使 用 
ABC 可 以 清楚 地 说 明 程序 员 的 意图 ， 从 而 使 代码 更 易于 理解 。 建 议 你 阅读 abc 模块 文档 ， 并 留 
意 适 用 这 种 模式 的 情形 。 



































关键 要 点 


口 抽象 基 类 〈ABC ) 能 在 派生 类 实例 化 时 检查 其 是 否 实现 了 基 类 中 的 某 些 特定 方法 。 
口 使 用 ABC 可 以 帮助 避免 bug 并 使 类 层次 易于 理解 和 维护 。 








4.6 ”namedtuple 的 优点 


Python 有 专门 的 namedtuple 容 需 类 型 ， 但 似乎 没有 得 到 应 有 的 重视 。 这 是 Python 中 那些 缺 
乏 关注 但 又 令 人 惊叹 的 特性 之 一 。 


利用 namedtuple 可 以 手动 定义 类 (class )， 除 此 之 外 ， 本 节 还 会 介绍 namedtuple 中 其 他 有 
趣 的 特性 。 


那么 namedtuple 是 什么 ， 有 什么 特别 之 处 呢 ? 理解 namedtuple 的 一 个 好 方法 是 将 其 视 为 内 
置 元 组 数据 类 型 的 扩展 。 


Python 的 元 组 是 用 于 对 任意 对 象 进行 分 组 的 简单 数据 结构 。 元 组 也 是 不 可 变 的 , 创建 后 就 不 
能 修改 。 来 看 一 个 简单 的 例子 : 


SS Do SOU le Wo) ove ya) 

> 

('hello', <object object at 0x105e76b70>，42) 
> 

村 2 
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三 
TypeError: 
"'tuple' object does not support item assignment”" 

















简单 元 组 有 一 个 缺点 , 那 就 是 存储 在 其 中 的 数据 只 能 通过 整数 索引 来 访问 。 无 法 给 存储 在 元 
组 中 的 单个 属性 赋予 名 称 ， 因 而 代码 的 可 读 性 不 高 。 


另外 , 元 组 是 一 种 具有 单 例 性 质 的 数据 结构 , 很 难保 证 两 个 元 组 存 有 相同 数量 的 字段 和 相同 
属性 ， 因 此 很 容易 因为 不 同 元 组 之 间 的 字段 顺序 不 同 而 引入 难以 意识 到 的 bug。 

















自 


en 


4.6.1 namedtuple 上 场 
namedtuple 旨 在 解决 两 个 问题 。 


首先 , 与 普通 元 组 一 样 ，namedtuple 是 不 可 变 容器 。 一 旦 将 数据 存储 在 namedtuple 的 顶层 属 
性 中 ， 就 不 能 更 新 属性 了 。namedtuple 对 象 上 的 所 有 属性 都 遵循 “一 次 写 人 ,多 次 读 取 ” 的 原则 。 

















其 次 , namedtuple 就 是 具有 名 称 的 元 组 。 存 储 在 其 中 的 每 个 对 象 都 可 以 通过 唯一 的 (人 类 可 
读 的 ) 标识 符 来 访问 。 因 此 不 必 记 住 整数 索引 ,也 无 须 采 用 其 他 变通 方法 ,如 将 整数 常量 定义 为 
索引 的 助 记 符 。 


下 面 来 看 看 namedtuple: 
































>>> from collections import namedtuple 
SO On nn osu ee me ee) 





namedtuple 在 Python 2.6 被 首次 添加 到 标准 库 中 。 使 用 时 需要 导入 collections 模块 。 上 
面 的 例子 中 定义 了 一 个 简单 的 car 数据 类 型 含有 color 和 mileage 两 个 字段 。 


你 可 能 想 知道 为 什么 本 例 中 将 字符 串 'car ' 作 为 第 一 个 参数 传递 给 namedtuple 工厂 函数 。 
这 个 参数 在 Python 文档 中 被 称 为 typename, 在 调用 namedtuple 函数 时 作为 新 创建 的 类 名 称 。 


由 于 namegdtuple 并 不 知道 创建 的 类 最 后 会 赋 给 哪个 变量 ， 因 此 需要 明确 告诉 它 需 要 使 用 
的 类 名 。namedtuple 会 自动 生成 文档 字符 串 和 ”_repr ， 其 中 的 实现 中 会 用 到 类 名 。 

在 这 个 例子 中 还 有 另外 一 个 奇特 的 语法 : 为 什么 将 字段 作为 'color mileage' 这 样 的 字符 
串 整 体 传递 ? 

答案 是 namedtuple 的 工厂 函数 会 对 字段 名 称 字符 串 调 用 split () ， 将 其 解析 为 字段 名 称 列 
表 。 分 开 来 就 是 下 面 这 两 步 : 

SES rerollen es ee 


LeolorL se Inaleace 
SO me ne Car ol ma 
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当然 ， 如 果 更 倾向 于 分 开 写 的 话 , 也 可 以 直接 传人 带 有 字符 串 字 段 名 称 的 列表 。 使 用 列表 的 
好 处 是 ， 在 需要 拆 分 成 多 行 时 可 以 更 轻松 地 重新 格式 化 代码 : 
> Ca = Namedtuplet car | 


Varealene ny 
‘mileage', 








| 
无 论 以 什么 方式 初始 化 ， 现 在 都 可 以 使 用 car 工厂 函数 创建 新 的 “汽车 ”对 象 ， 其 效果 和 手 
动 定义 car 类 并 提供 一 个 接受 color 和 mileage 值 的 构造 函数 相同 : 


Sn 
Dom ne 

‘red’"' 

>>> my_car.mileage 

2 


除了 通过 标识 符 来 访问 存储 在 namedtuple 中 的 值 之 外 , 索引 访问 仍然 可 用 。 因 此 namedtuple 
可 以 用 作 普 通 元 组 的 替代 品 : 


| 
‘red" 

>>> tuple (my_car) 
(ree 


元 组 解 包 和 用 于 函数 参数 解 包 的 * 操 作 符 也 能 正常 工作 : 


>>> color, mileage = my_car 
>>> print (color, mileage) 
reel Sha 2 

Ee nn 

Te Sal ae 


自动 得 到 的 namedtuple 对 象 字 符 串 形式 也 挺 不 错 的 ， 不 用 自己 编写 相关 函数 了 : 
































> 
CORE) 

















与 元 组 一 样 ，namedtuple 是 不 可 变 的 。 试 图 覆盖 某 个 字段 时 会 得 到 一 个 AEtEriputeError 
蕊 尖 - 
天 的 





> me 0 IY 
emeror: eomn le ot el 


namedtuple 对 象 在 内 部 是 以 普通 的 Python 类 实现 的 。 当 涉及 内 存 使 用 时 , namedtuple 比 普通 
类 “更 好 ”， 它 和 普通 元 组 的 内 存 占 用 都 比较 少 。 


可 以 这 么 看 : namedtuple 适合 在 Python 中 以 节省 内 存 的 方式 快速 手动 定义 一 个 不 可 变 
的 类 。 
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4.6.2 子 类 化 namedtuple 


为 namedtuple 建立 在 普通 Python 类 之 上 , 所 以 还 可 以 向 namedtuple 对 象 添加 方法 。 例 如 ， 
可 以 像 其 他 类 一 样 扩展 namedtuple 定义 的 类 ， 为 其 添加 方法 和 新 属性 。 来 看 一 个 例子 : 














Car = namedtuple('Car', 'color mileage') 


class MyCarWithMethods (Car): 
def hexcolor (self): 
eol =e 
re ene (OO 
else: 
return '#000000"' 





现在 能 够 创建 MvcarwithMethods 对 象 并 调用 nexcolor () 方 法 了 ， 就 像 预 期 的 那样 : 
SS le = Me eva ne ee M2 3) 


SEE re meero on) 
'#ff0000" 


这 种 方式 可 能 有 点 笨拙 ， 但 适合 构建 具有 不 可 变 属性 的 类 ， 不 过 也 很 容易 带 来 其 他 问题 。 


例如 ， 由 于 namedtuple 内 部 的 结构 比较 特殊 ， 因 此 很 难 添 加 新 的 不 可 变 字段 。 另 外 ， 创 建 
namedtuple 类 层次 的 最 简单 方法 是 使 用 基 类 元 组 的 _fields 属性 : 















































SO name mea ol du) 
>>> ElectricCar = namedtuplel( 
Pp ee DU en aso ee) 














结果 符合 预期 


0 
EGR 


4.6.3 内置 的 辅助 方法 


除了 _fielgs 属性 ， 每 个 namedtuple 实例 还 提供 了 其 他 一 些 有 用 的 辅助 方法 。 这 些 方法 都 
以 单 下 划 线 (_) 开头 。 单 下 划 线 通常 表示 方法 或 属性 是 “私有 ”的 ， 不 是 类 或 模块 的 稳定 公共 
接口 的 一 部 分 。 

然而 在 namedtuple 中 ， 下 划 线 具有 不 同 的 含义 。 这 些 辅 助 方法 和 属性 是 namedtuple 公共 接 
口 的 一 部 分 ,以 单 下 划 线 开头 只 是 为 了 避免 与 用 户 定义 的 元 组 字段 发 生命 名 冲突 。 所 以 在 需要 时 
就 尽管 使 用 吧 。 

下 面 会 介绍 一 些 能 用 到 这 些 namedtuple 辅助 方法 的 情形 。 我 们 从 _asaict ( ) 辅助 方法 开始 ， 
该 方法 将 namedtuple 的 内 容 以 字典 形式 返回 : 



























































4.6 namedtuple 的 优点 71 





En on ee 
OreernesDeue (selon nA 


这 样 在 生成 JSON 输出 时 可 以 避免 拼 错字 段 名 称 : 


Sn ono ne ee 
CO OE Ce A 

















男 一 个 有 用 的 辅助 函数 是 _replace () 。 该 方法 用 于 创建 一 个 元 组 的 浅 副 本 ， 并 能 够 选择 替 
换 其 中 的 一 些 字 段 : 














> Tn ar reDlaceleoLlLors= "DLIue,) 
Gon (leoler= le ode = 


最 后 介绍 的 是 _make () 类 方法 ， 用 来 从 序列 或 迭代 对 象 中 创建 namedtuple 的 新 实例 : 








SS Co nae ye .9 
Car (color='red', mileage=999) 


4.6.4” 何 时 使 用 namedtuple 
namedtuple 能 够 更 好 地 组 织 数据 的 结构 ， 让 代码 更 整洁 、 更 易 读 。 


例如 , 将 格式 固定 、 针 对 特定 场景 的 数据 类 型 ( 比如 字典 ) 替换 为 namedtuple 能 更 清楚 地 表 
达 开 发 者 的 意图 。 通常， 当 我 尝试 以 这 种 方式 重 构 时 ,就 会 神奇 地 为 眼前 的 问题 想 出 一 个 更 好 的 
解决 方案 。 

用 namedtuple 替换 非 结 构 化 的 元 组 和 字典 还 可 以 减轻 同事 的 负担 ， 因 为 namedtuple 让 数据 
在 传递 时 在 某 种 程度 上 做 到 了 自 说 明 ( self documenting )。 

另 一 方面 , 如 果 namedtuple 不 能 帮 我 编写 更 整洁 、 更 易 维 护 的 代码 , 那么 我 会 尽量 避免 使 用 。 
像 本 书 介 绍 的 许多 其 他 技术 一 样 ， 滥 用 namedtuple 会 带 来 负面 影响 。 


但 只 要 仔细 使 用 ，namedtuples 无 疑 能 让 Python 代码 更 好 、 更 可 读 。 

















4.6.5 ”关键 要 点 
口 collection.namedtuple 能 够 方便 地 在 Python 中 手动 定义 一 个 内 存 占 用 较 少 的 不 可 


变 类 。 


口 使 用 namedtuple 能 按照 更 易 理 解 的 结构 组 织 数据 ， 进 而 简化 了 代码 。 
口 namedtuple 提供 了 一 些 有 用 的 辅助 方法 , 虽然 这 些 方法 以 单 下 划 线 开头 , 但 实际 上 是 公共 
接口 的 一 部 分 ， 可 以 正常 使 用 。 
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4.7 ”类 变量 与 实例 变量 的 陷阱 
不 仅 类 方法 和 实例 方法 之 间 有 区 别 ，Python 的 对 象 模型 中 类 变量 和 实例 变量 也 有 所 区 别 。 


这 种 区 别 非常 重要 ， 在 刚 接触 Python 时 给 我 带 来 了 不 少 烦 恼 。 在 很 长 一 段 时 间 里 ， 我 都 没 
有 花 时 间 从 头 开始 理解 这 些 概念 , 所 以 我 早期 面向 对 象 的 代码 中 充满 了 令 人 惊讶 的 行为 和 奇怪 的 
错误 。 本 闻 将 通过 一 些 实践 示例 来 理 清 曾 经 引起 我 困惑 的 地 方 。 

就 像 我 刚刚 说 的 那样 ，Python 对 象 有 两 种 数据 属性 : 类 变量 和 实例 变量 。 

类 变 A Re Oi i oa Dd ssi a 类 变量 将 
a ea 从 特定 类 创建 的 所 有 对 象 都 可 以 访问 同一 组 类 变量 。 这 意味 着 修改 类 变 

会 同时 影响 所 有 对 象 实例 。 

实例 变量 总 是 绑 定 到 特定 的 对 象 实例 。 它 的 内 容 不 存储 在 类 上 ,而 是 存储 在 每 个 由 类 创建 的 
单个 对 象 上 。 因 此 实例 变量 的 内 容 与 每 个 对 象 实例 相关 , 修改 实例 变量 只 会 影响 对 应 的 对 象 实例 。 

好 吧 ， 这 些 描 述 相当 抽象 ， 下 面 来 看 一 些 代码 。 这 里 继续 使 用 老 掉 牙 的 “ 狗 狗 示例 ”。 出 于 
某 种 原因 ， 许 多 面向 对 象 的 教程 总 是 使 用 汽车 或 宠物 来 举例 说 明 ， 这 个 传统 很 难 打破 。 


快乐 的 狗 需 要 什么 ”四 条 腿 和 一 个 名 字 : 


chase BOGS 
站 






















































































efor em tect nomed: 
Self.name = name 和 <- 实例 变量 


好 吧 ， 这 就 是 用 狗 狗 示例 来 描述 的 面向 对 象 的 形式 。 创 建新 的 Dog 实例 能 正常 工作 ， 并 且 
每 个 实例 都 会 获得 一 个 名 为 name 的 实例 变量 : 


el DON rel 

> > Do 
>>> jack.name, jill.name 
(CN le a 


























涉及 类 变量 时 就 比较 灵活 了 , 在 每 个 Dog 实例 或 类 本 身上 可 以 直接 访问 num_legs 类 变量 : 


> nn ne 
(4, 4) 
>>> Dog.num_ legs 











然而 ， 如 果 尝 试 通过 类 访问 实例 变量 ,会 失败 并 抛 出 AttributeError。 实 例 变 量 是 特定 


于 每 个 对 象 实例 的 ， 在 运行 _init_ 构造 函数 时 创建 ， 并 不 位 于 类 本 身 中 。 
这 就 是 类 变量 和 实例 变量 之 间 的 核心 区 别 : 
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>>> Dog .name 
a SD CGE 
"type object 'Dog' has no attribute ‘'name’'™”" 


好 吧 ， 到 目前 为 止 还 行 。 
假如 有 一 天 ,一 只 名 为 Jack 的 狗 在 吃 晚餐 时 与 微波 炉 靠 得 太 近 ， 发 生变 异 又 长 出 了 一 双 腿 ， 
那么 如 何在 代码 中 表示 呢 ? 


第 一 个 想法 可 能 是 简单 地 修改 Dog 类 中 的 num_legs 变量 : 























SR DO re So 


但 记 住 , 我 们 不 希望 所 有 的 狗 都 开始 用 六 条 腿 四 处 乱 跑 。 由 于 修改 了 类 变量 ,因此 现在 把 所 
有 的 狗 都 变 成 了 超级 狗 。 这 会 影响 到 所 有 的 狗 ， 甚 至 是 之 前 创建 的 狗 : 





>>> jack.num legs, jill.num legs 
(5 


所 以 这 种 方式 不 行 , 原因 是 修改 类 名 称 空间 上 的 类 变量 会 影响 类 的 所 有 实例 。 现在 撤销 这 个 
对 类 变量 的 改动 ， 而 是 尝试 仅 向 Jack 添加 额外 两 条 腿 : 











六 CE 有 SEA 
SS ein Io 


来 看 看 这 种 方式 创造 了 什么 怪物 : 


E> elel nom Le ql sb ee Doyen album els 
(6, 4, 4) 


好 吧 ， 看 起 来 “相当 不 错 ”( 除了 可 怜 的 Jack 多 了 两 条 腿 )。 但 这 种 改动 是 如 何 影响 Dog 对 
象 的 呢 ? 

这 里 的 难点 在 于 ， 虽 然 得 到 了 想 要 的 结果 ( 为 Jack 添加 两 条 腿 ), 但 在 Jack 实例 中 引入 了 一 
个 num_legs 实例 变量 。 而 新 的 num_legs 实例 变量 “遮盖 ”了 相同 名 称 的 类 变量 ， 在 访问 对 
象 实例 作用 域 时 履 盖 并 隐藏 类 变量 : 


> le la es 
(6, 4) 


从 上 面 可 以 看 到 ,类 变量 没有 同步 更 新 , 这 是 因为 写 人 到 jack.num_legs 创建 了 一 个 与 类 
变量 同名 的 实例 变量 。 

这 不 一 定 是 坏事 ， 重 要 的 是 要 意识 到 背后 发 生 的 事情 。 在 最 终了 解 Python 中 的 类 层面 和 实 
例 层 面 的 作用 域 规则 之 前 ， 很 容易 因为 这 些 问 题 在 程序 中 引入 bug。 

说 实话 , 试图 通过 对 象 实例 修改 类 变量 时 意外 地 创建 了 一 个 名 称 相同 的 实例 变量 , 从 而 隐藏 
了 原来 的 类 变量 。 这 有 点 像 是 Python 中 的 一 个 OOP 陷阱 。 
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4.7.1 与 狗 无 关 的 例子 


在 本 节 的 写作 过 程 中 , 没有 狗 受到 伤害 ( 这 里 只 是 为 了 描述 起 来 更 加 生动 有 趣 , 并 不 能 真 的 
为 狗 添加 两 条 腿 )。 下 面 用 一 个 更 加 实际 的 例子 来 介绍 类 变量 的 用 途 ， 在 更 接近 实际 的 应 用 程 
中 使 用 类 变量 。 


下 面 就 来 看 这 样 一 个 例子 , 其 中 的 countedobject 类 记录 了 它 在 程序 生命 周期 中 实例 化 的 
次 数 〈 实 际 上 这 可 能 是 一 个 有 趣 的 性 能 指标 ): 
































class Countedobject : 
num_instances = 0 


defer mete 
self ela Mmmetanees rT 


Countedobject 保留 一 个 用 作 共 享 计 数 器 的 num_instances 类 变量 。 当 声明 该 类 时 ， 计 
数 需 初始 化 为 零 后 就 不 再 改变 了 。 

















每 次 创建 此 类 的 新 实例 时 ， 会 运行 _init 构造 函数 并 将 共享 计数 器 递 
>>> Countedqobject .num_instances 

人 Countedqobject () .num instances 

0 CountedObject() .num instances 

9 CountedObject() .num instances 

全 Countedqobject .num_instances 

3 

















注意 这 段 代 码 需要 额外 的 _ class_ 来 确保 增加 的 是 类 上 的 计数 器 变量 ,有 时 候 很 容易 犯 下 
面 这 种 错误 : 
# 警告 : 这 种 实现 有 bug 


class BuggyCountedObject: 
num_instances = 0 


GEE ote See 
self.num instances += 1 El 


从 中 可 以 看 到 ， 这 个 糟糕 的 实现 永远 不 会 增加 共享 计数 絮 变 量 : 


>>> BuggyCountedObject .num instances 

0 

>>> BuggyCountedObject() .num instances 
业 

>>> BuggyCountedObject() .num instances 
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Seuogo eounseaoneee ll mm eamees 


>>> BuggyCountedObject .num instances 
0 























相信 你 现在 意识 到 哪里 出 错 了 。 这 个 糟糕 的 实现 永远 不 会 增加 共享 计数 器 ,因为 我 犯 了 在 前 
面 的 Jack 示例 中 已 经 解释 的 错误 。 这 个 实现 不 起 作用 ， 因 为 在 构造 函数 中 创建 一 个 名 称 相同 的 


实例 变量 ， 意 外 地 “ 庶 关 ”了 num_instance 类 变量 。 


代码 先 正确 地 计算 了 计数 器 的 新 值 ( 从 0 增加 到 1 )， 然 后 将 结果 存储 在 实例 变量 中 ， 因 此 
该 类 的 其 他 实例 看 不 到 修改 后 的 计数 器 值 。 


不 难看 出 这 是 一 个 易 犯错 误 。 在 处 理 类 上 的 共享 状态 时 , 应 小 心 并 仔细 检查 共享 状态 的 作用 
范围 。 自 动 化 测试 和 同行 评审 对 此 有 很 大 帮助 。 


尽管 类 变量 中 有 陷阱 ， 但 希望 你 能 明白 其 优点 以 及 如 何在 实践 中 使 用 。 祝 你 好 运 ! 



































4.7.2 ”关键 要 点 


口 类 变量 用 于 类 的 所 有 实例 之 间 共 享 数据 。 类 变量 属于 一 个 类 ， 在 类 的 所 有 实例 中 共享 ， 
而 不 是 属于 某 个 特定 的 实例 。 

口 实例 变量 是 特定 于 每 个 实例 的 数据 ， 属 于 单个 对 象 实例 ， 不 与 类 的 其 他 实例 共享 。 每 个 
实例 变量 都 针对 特定 实例 单独 存储 了 一 份 。 

口 因为 类 变量 可 以 被 同名 的 实例 变量 “遮盖 ”>， 所 以 很 容易 〈 意外 地 ) 由 于 覆盖 类 变量 而 引 
和 人 bug 和 奇怪 的 行为 。 








< 

















4.8 实例 方法 、 类 方法 和 静态 方法 揭秘 
本 节 将 深入 探寻 Python 中 的 类 方法 、 静 态 方法 和 普通 实例 方法 。 


在 对 这 些 方法 之 间 的 差异 有 直观 的 理解 后 ， 就 能 以 面向 对 象 的 形式 编写 Python 代码 了 ， 从 
而 更 清楚 地 传达 代码 的 意图 ， 而 且 从 长 远 来 看 代码 更 易 维护 。 


首先 来 编写 一 个 类 ， 其 中 包含 这 三 种 方法 的 简单 示例 (Python 3 版 ): 


lass MYyCLIAaSe: 
def method(self): 
Re eneenmeene ea Es 











@classmethod 
def classmethod(cls): 
return 'class method called', cils 


@staticmethod 
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def staticmethod(): 
return 'static method called' 








Python 2 用 户 需要 注意 : 从 Python 2.4 开始 才 可 以 使 用 estaticmethod 和 eclassmethod 
装饰 器 ， 因 此 此 后 的 版 本 才能 运行 这 个 示例 。 另 外 ， 还 需要 使 用 class Myclass (object) 这 
种 语法 来 声明 这 是 继承 自 obj ect 的 新 式 类 ， 而 不 是 使 用 普通 的 class Myclass 语法 。 除 了 这 
些 之 外 就 没有 其 他 问题 了 。 








4.8.1 实例 方法 


MyClass 上 的 第 一 种 方法 名 为 method, 这 是 一 个 普通 的 实例 方法 。 代 码 中 一 般 出 现 的 都 是 
这 种 简单 基础 的 实例 方法 。methoa 方法 需要 一 个 参数 self， 在 调用 时 指向 Myclass 的 一 个 实 
例 。 当 然 ， 实 例 方 法 可 以 接受 多 个 参数 。 


实例 方法 通过 self 参数 在 同一 个 对 象 上 自由 访问 该 对 象 的 其 他 属性 和 方法 , 因此 特别 适合 
修改 对 象 的 状态 。 

实例 方法 不 仅 可 以 修改 对 象 状态 ， 也 可 以 通过 self. class。_ 属性 访问 类 本 身 。 这 意味 
着 实例 方法 也 可 以 修改 类 的 状态 。 















































4.8.2 ”类 方法 


与 第 一 种 方法 相 比 ， 第 二 种 方法 MyClass .classmethod 使 用 了 eclassmethod 装饰 器 "， 
将 其 标记 为 类 方法 。 


类 方法 并 不 接受 self 参数 ， 而 是 在 调用 方法 时 使 用 cls 参数 指向 类 ( 不 是 对 象 实例 )。 


由 于 类 方法 只 能 访问 这 个 cls 参数 ， 因 此 无 法 修改 对 象 实例 的 状态 ， 这 需要 用 到 self。 但 
类 方法 可 以 修改 应 用 于 类 所 有 实例 的 类 状态 。 






































4.8.3 ”静态 方法 
第 三 种 方法 Mvclass.staticmethod 使 用 astaticmethod 装饰 器 2 将 其 标记 为 静态 方法 。 
这 种 类 型 的 方法 不 接受 self 或 cls 参数 ， 但 可 以 接受 任意 数量 的 其 他 参数 。 


因此 ,静态 方法 不 能 修改 对 象 状态 或 类 状态 , 仅 能 访问 特定 的 数据 ,主要 用 于 声明 属于 某 个 
命名 空间 的 方法 。 


























GD 详 见 Python 文档 :“eclassmethoq”。 
@) 详 见 Python 文档 :“@staticmethod”。 











4.8 实例 方法 、 类 方法 和 静态 方法 揭秘 7 





4.8.4 在 实践 中 探寻 


到 目前 为 止 都 是 非常 理论 化 的 讨论 ， 而 重要 的 是 在 实践 中 直观 地 理解 这 些 方法 之 间 的 区 别 ， 
因此 这 里 来 介绍 一 些 具体 的 例子 。 

让 我 们 来 看 看 调用 这 些 方法 时 其 各 自 的 行为 。 首 先 创建 一 个 类 的 实例 , 然后 调用 三 种 不 同 的 
方法 。 

Myclass 中 进行 了 一 些 设置 ， 其 中 每 个 方法 的 实现 都 会 返回 一 个 元 组 ， 包 含 当 前 方法 的 说 
明 信 息 和 该 方法 可 访问 的 类 或 对 象 的 内 容 。 

以 下 是 调用 实例 方法 时 的 情况 : 


> 
TEST 
('instance method called', <MyClass instance at 0xlla2>) 


从 中 可 以 确认 ， 名 为 method 的 实例 方法 可 以 通过 self 参数 访问 对 象 实例 (输出 为 
<MyClass instance> )。 

调用 该 方法 时 ，Python 用 实例 对 象 obj 替换 self 变量 。 如 果 不 用 obj .methoq () 这 种 点 
号 调用 语法 糖 ， 手 动 传递 实例 对 象 也 会 获得 相同 的 结果 : 


>>> MyClass.method (obj) 
('instance method called', <MyClass instance at 0xlla2>) 


顺便 说 一 下 ， 在 实例 方法 中 也 可 以 通过 self. class ”属性 访问 类 本 身 。 这 使 得 实例 方 
法 在 访问 方面 几乎 没什么 限制 ， 可 以 自由 修改 对 象 实例 和 类 本 身 的 状态 。 
接 下 来 尝试 一 下 类 方法 : 


>>> obj.classmethod () 
(volass meEhod called’,. <elases MyClass at (XLLa2S) 















































调用 classmethod () 的 结果 表明 其 不 能 访问 <Myclass instance> 对 象 , 只 能 访问 <class 
Myclass> 对 象 ， 这 个 对 象 用 来 表示 类 本 身 ( Python 中 一 切 皆 为 对 象 ， 类 本 身 也 是 对 象 )。 

注意 ,在 调用 Myvclass.classmethodq() 时 ，Python 自动 将 类 作为 第 一 个 参数 传递 给 该 函数 。 
在 Python 中 用 点 语法 (dot syntax ) 调用 该 方法 就 会 触发 这 个 行为 。 实 例 方法 的 self 参数 的 工作 
方式 也 是 如 此 。 

注意 ，self 和 cls 这 些 参数 的 命名 只 是 一 个 约定 。 你 可 以 将 其 命名 为 the_object 和 
the_class， 结 果 相 同 ， 只 要 这 些 参数 位 于 相关 方法 中 参数 列表 的 第 一 个 位 置 即 可 。 

现在 来 调用 静态 方法 : 


>>> obj.staticmethod() 
'static method called’ 
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注意 到 没有 ， 在 对 象 上 可 以 调用 staticmethodqd()。 有 些 开 发 人 员 在 得 知 可 以 在 对 象 实例 
上 调用 静态 方法 时 会 感到 惊讶 。 





从 实现 上 来 说 , Python 在 使 用 点 语法 调用 静态 方法 时 不 会 传人 self 或 cls 参数 , 从 而 限制 
委 态 方法 访问 的 内 容 。 








了 











bun 


这 意味 着 静态 方法 既 不 能 访问 对 象 实例 状态 , 也 不 能 访问 类 的 状态 。 静态 方法 与 普通 函数 一 
样 , 但 属于 类 ( 和 每 个 实例 ) 的 名 称 空间 。 


现在 不 创建 对 象 实例 ， 看 看 在 类 本 身上 调用 静态 方法 时 会 发 生 什么 : 








>>> MyClass.classmethod() 
toelass-method called ,<eLlaso MYOIGaSes a OXxlia2Ssd 


>>> MyClass.staticmethod() 
‘static method called' 


>>> MyClass.method () 

TypeError: """unbound method method() must be 
called with MyClass instance as first 
einamert (oo noel te 








调用 classmethod() 和 staticmethod() 没 有 问题 ， 但 试图 调用 实例 方法 method () 会 失 
败 并 出 现 TypeError。 





























这 是 预料 之 中 的 。 由 于 没有 创建 对 象 实例 ， 而 是 直接 在 类 蓝图 (blueprint ) 上 调用 实例 方 
法 ,意味 着 Python 无 法 填充 self 参数 ,因此 调用 实例 方法 method 会 失败 并 抛 出 TypeError 
已 
异 


常 。 











通过 这 些 实验 , 你 应 该 更 清楚 这 三 种 方法 类 型 之 间 的 区 别 了 。 别 担心 , 现在 还 不 会 结束 这 个 
话题 。 在 接 下 来 的 两 节 中 ， 还 将 用 两 个 更 接近 实际 的 例子 来 使 用 这 些 特殊 方法 。 


下 面 以 前 面 的 例子 为 基础 ， 创 建 一 个 简单 的 Pizza 类 : 














class Pizza: 
def _ init _(self, ingredients): 
self.ingredients = ingredients 


def __ repr__(self): 
return f'Pizza({self.ingredients!r})' 


> ecu omaeeoes IN 
Pizza(['cheese', 'tomatoes']) 


4.8.5 使 用 eclassmethod 的 Pizza 工厂 类 





如 果 你 在 现实 世界 中 吃 过 比萨 ， 那 么 就 会 知道 比萨 有 很 多 种 口味 可 供 选择 : 
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elo ne ole omareeso 
Baan ne an onaeoes nm me 
re | me ene le | 2 et 


几 个 世纪 以 前 , 意大利 人 就 对 比萨 进行 了 分 类 ， 所 以 这 些 美味 的 比萨 饼 都 有 自己 的 名 字 。 下 
面 根据 这 个 特性 为 Pizza 类 提供 更 好 的 接口 ， 让 用 户 能 创建 所 需 的 比萨 对 象 。 


使 用 类 方法 作为 工厂 函数 "能 够 简单 方便 地 创建 不 同 种 类 的 比萨 : 








ale Ble 
def yy gme cele Jnogredqients): 
self.ingredients = ingredients 


def __ repr__(self): 
Tet urn Ee plo el eene el 


@classmethod 
def margherita (cls): 
return cls(['mozzarella', 'tomatoes']) 


@classmethod 
qete oreoce nner(eney 
Keturn eles (mezZ2onrelle 9 omatoes am 














注意 我 们 在 margherita 和 prosciutto 工厂 方法 中 使 用 了 cls 参数 ， 而 没有 直接 调用 
Pizza 构造 函数 。 


个 技巧 遵循 了 “不 要 重复 自己 ”( DRY ) “原则 。 如 果 打 算 在 将 来 重 命名 这 个 类 ， 就 不 必 更 
1 数 中 的 构造 函数 名 称 。 


那么 这 些 工厂 方法 能 做 什么 ? 来 尝试 一 下 














SS Pili220 mronerieo() 
plzzoll oonel omnes 


> ee 
Bae ne snes enue em | 





从 中 可 以 看 到 ， 工 三 函数 创建 的 新 Pizza 对 象 按照 期 望 的 方式 进行 了 配置 ， 这 些 函 数 在 内 
部 都 使 用 相同 的 __init 构造 函数 ， 作 为 一 种 快捷 的 方式 来 记录 不 同 的 配方 。 


从 男 一 个 角度 来 说 ， 这 些 类 方法 为 类 定义 了 额外 的 构造 函数 。 


Python 只 人 允许 每 个 类 有 一 个 _init 方法。 使 用 类 方法 可 以 按 需 添加 额外 的 构造 函数 ， 使 
得 类 的 接口 在 一 定 程度 上 能 做 到 “ 自 说 明 ”， 同 时 简化 了 类 的 使 用 。 















































Q@ 详 见 维基 百科 :“ 工 厂 ( 面向 对 象 编程 。 
@) 详 见 维基 百科 :“Donm’t repeat yourself”。 
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4.8.6 ”什么 时 候 使 用 静态 方法 


为 这 个 主题 提供 一 个 好 例子 有 点 难 ， 所 以 继续 使 用 前 面 的 比萨 例子 ， 把 比萨 烤 得 越 来 越 
注 …… (要 流 口水 了 !) 


下 面 是 我 想到 的 : 

















a oe ie lie 


class Pizza: 
le Eo (Cl le en 
Se chs mas 
self.ingredients = ingredients 


ef repr= "(Selt)s 
ee he nn (ae Oars (0 re lal | 


f'{self.ingredients!r})') 


def area (self): 
er (ey 


@staticmethod 


def circle area(r): 
lee 2 ne Elo 


这 里 做 了 哪些 改动 呢 ? 
首先 ， 修 改 了 构造 函数 和 __repr_ 以 接受 额外 的 radius 参数 。 





其 次 ,添加 了 一 个 area() 实 例 方法 用 于 计算 并 返回 比萨 的 面积 。 虽 然 这 里 更 适合 使 用 
eproperty 装饰 顺 ， 不 过 对 于 这 个 简单 的 示例 来 说 ， 那 么 做 的 话 就 有 些 大 动 干 驴 了 。 


area () 并 没有 直接 计算 面积 , 而 是 调用 circle_area() 静 态 方法 ,后 者 使 用 众所周知 的 圆 
面积 公式 来 计算 。 




















下 面 来 试 试 吧 ! 
0 
ey 


Pizza(4, {self.ingredients}) 
二 ea 

S50 2050 2 Td 

>>> Pizza.circle area(4) 

S(O 2 De SS 


当然 这 仍然 是 一 个 简单 的 例子 ， 不 过 有 助 于 说 明 静 态 方法 的 好 人 处 。 


之 前 已 经 介绍 了 ， 静态 方法 不 能 访问 类 或 实例 的 状态 ， 因 为 静态 方法 不 会 接受 cls 或 self 
数 。 这 是 一 个 很 大 的 局 限 性 ,但 也 很 好 地 表明 了 静态 方法 与 类 的 其 他 所 有 内 容 都 无 关 。 





Wy 
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在 上 面 的 例子 中 , 很 明显 circle_area() 不 能 以 任何 方式 修改 类 或 类 实例 。( 当然 , 你 可 以 
用 全 局 变量 来 解决 这 个 问题 ， 不 过 这 不 是 重点 。) 

那么 这 种 功能 有 什么 用 呢 ? 

将 方法 标记 为 静态 方法 不 仅 是 一 种 提示 , 告诉 大 家 这 个 方法 不 会 修改 类 或 实例 状态 , 而 且 从 
上 面 可 以 看 到 ，Python 运行 时 也 会 实际 落实 这 些 限 制 。 

通过 这 样 的 技术 可 以 清晰 地 识别 出 类 架构 的 各 个 部 分 , 因而 新 的 开发 工作 能 够 很 自然 地 分 配 
到 对 应 的 部 分 中 。 虽然 不 遵守 这 种 限制 也 没什么 大 问题 , 但 在 实践 中 常常 能 避免 与 原始 设计 相悖 
的 意外 修改 。 

换 句 话说 ,使 用 静态 方法 和 类 方法 不 仅 能 传达 开发 人 员 的 意图 ， 还 能 够 强制 贯彻 设计 思路 ， 
避免 许多 心 不 在 看 的 错误 以 及 会 破坏 设计 的 bug。 

此 请 谨慎 地 按 需 使 用 静态 方法 , 添加 静态 方法 对 代码 维护 有 好 处 , 能 避免 其 他 开发 人 员 误 
用 你 的 类 。 

静态 方法 也 有 助 于 编写 测试 代码 。 由 于 circle_area() 方 法 与 类 的 其 余部 分 完全 独立 ， 
此 测试 起 来 更 加 容易 。 

在 单元 测试 中 测试 静态 方法 时 不 需要 建立 完整 的 类 实例 , 可 以 像 测试 普通 函数 那样 直接 测试 
静态 方法 。 这 不 仅 简化 了 维护 ， 而 且 在 面向 对 象 和 面向 过 程 的 编程 风格 之 间 建 立 了 联系 。 












































4.8.7 ”关键 要 点 


口 实例 方法 需要 一 个 类 实例 ， 可 以 通过 self 访问 实例 。 

口 类 方法 不 需要 类 实例 ， 不 能 访问 实例 (self ), 但 可 以 通过 cls 访问 类 本 身 。 

口 静态 方法 不 能 访问 cls 或 self， 其 作用 和 普通 函数 相同 ， 但 属于 类 的 名 称 空间 。 

口 静态 方法 和 类 方法 能 ( 在 一 定 程度 上 ) 展示 和 贯彻 开发 人 员 对 类 的 设计 意图 ， 有 助 于 代 
码 维护 。 



































Python 中 帝 见 的 数据 结构 








有 没有 什么 是 每 个 Python 开发 者 都 应 该 进一步 练习 和 学 习 的 呢 ? 


那 就 是 数据 结构 。 数 据 结构 是 构建 程序 的 基础 。 各 个 数据 结构 在 组 织 方式 上 有 自己 的 特点 ， 
以 便 在 不 同情 况 下 高 效 访问 数据 。 


我 相信 无 论 程序 员 的 技术 水 平 或 经 验 如 何 ， 掌 握 一些 基 本 功 总 是 有 好 处 的 。 


我 并 不 主张 只 专注 于 掌握 更 多 的 数据 结构 知识 ,这 是 一 种 “失效 模式 ”( failure mode )， 只 会 
让 人 陷入 假想 理论 上 的 幻境 ， 而 不 会 带 来 任何 实际 的 结 


不 过 花 一 些 时 间 来 补习 数据 结构 ( 和 算法 ) 的 知识 总 会 有 好 处 。 
无 论 是 花 几 天 时 间 “ 罕 击 ”， 还 是 利用 零碎 的 时 间 持 续 学 习 ， 在 数据 结构 上 下 点 功夫 都 是 值 



































那么 Python 中 有 哪些 数据 结构 呢 ? 列表 、 字 典 、 集 合 ， 还 有 …… 栈 ? Python 有 栈 吗 ? 

看 到 没 ? Python 在 其 标准 库 中 提供 了 大 量 的 数据 结构 ， 但 问题 在 于 各 自 的 命名 有 点 词 不 达意 。 

举例 来 说 ， 很 多 人 甚至 不 清楚 Python 是 否 具体 实 现 了 像 栈 这 样 著 名 的 “抽象 数据 类 型 ”。 相 
比 之 下 ，Java 等 其 他 语言 则 更 “计算 机 科学 化 ”， 其 中 的 命名 很 明确 。 比 如 ，Java 中 的 列表 还 细 


分 成 了 LinkedList 和 ArrayList。 


这 种 细 分 的 命名 便于 我 们 识别 各 个 数据 类 型 的 预期 行为 和 计算 复杂 度 。 Python 也 倾向 于 使 用 
简单 旦 “人 性 化 ”的 命名 方案 。 我 喜欢 Python 的 方案 ， 因 为 人 性 化 也 是 Python 编程 更 有 趣 的 原 
因 之 一 oO 


这 种 方案 的 缺点 在 于 ， 即 使 是 经 验 丰富 的 Python 开发 人 员 ， 也 不 清楚 内 置 的 列表 类 型 是 以 
链表 还 是 动态 数组 实现 的 。 如 果 需 要 用 到 这 些 知识 却 没有 掌握 ,， 则 会 让 人 感到 诅 丧 ,也 可 能 导致 
面试 被 拒 。 

本 章 将 介绍 Python 及 其 标准 库 内 置 的 基本 数据 结构 和 抽象 数据 类 型 的 实现 。 
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我 的 目标 是 阐释 常见 的 抽象 数据 类 型 在 Python 中 对 应 的 名 称 及 实现 ， 并 逐个 进行 简单 的 介 
绍 。 这 些 内 容 也 会 帮助 你 在 Python 面试 中 大 放 异 彩 。 

如 果 你 正在 寻找 一 本 能 够 用 来 温习 通用 数据 结构 知识 的 好 书 ， 我 强烈 推荐 Steven S. Skiena 
的 《算法 设计 手册 六 

这 本 书 介绍 了 各 种 数据 结构 及 其 各 自在 不 同 算法 中 的 实际 应 用 , 并 在 这 两 个 方面 之 间 取 得 了 
很 好 的 平衡 。 它 对 我 编写 本 章 提 供 了 很 大 的 帮助 。 















































5.1 字典 、 映 射 和 散 列 表 


在 Python 中 ,字典 是 核心 数据 结构 。 字 典 可 以 存储 任意 数量 的 对 象 ， 每 个 对 象 都 由 唯一 的 
字典 键 标识 。 


字典 通常 也 被 称 为 映射 、 散 列表 、 查 找 表 或 关联 数组 。 字 典 能 够 高 效 查 找 、 搬 和 信和 删除 任何 
与 给 定 键 关 联 的 对 象 。 


这 在 现实 中 意味 着 什么 呢 ? 字典 对 象 相当 于 现实 世界 中 的 电话 短 。 


电话 簿 有 助 于 快速 检索 与 给 定 键 (人 名 ) 相关 联 的 信息 (电话 号 码 )。 因 此 不 必 
为 了 查找 某 人 的 号 码 而 浏览 整 本 电话 簿 ,根据 人 名 基本 上 就 能 直接 跳 到 需要 查找 的 相关 
信息 。 


若 想 研究 以 何 种 方式 组 织 信息 才 有 利于 快速 检索 ,上 述 类 比 就 不 那么 贴切 了 。 但 基本 性 能 特 
征 相 同 ， 即 字典 能 够 用 来 快速 查找 与 给 定 键 相 关 的 信息 。 


总 之 ,字典 是 计算 机 科学 中 最 常用 日 最 重要 的 数据 结构 之 一 。 
那么 Python 如 何 处 理 字 典 呢 ? 
我 们 来 看 看 Python 及 其 标准 库 中 可 用 的 字典 实现 。 















































首选 字典 实现 
由 于 字典 非常 重要 ， 因 此 Python 直接 在 语言 核心 中 实现 了 一 个 稳健 的 字典 ": aict 数据 


类 
A 
Python 还 提供 了 一 些 有 用 的 “语法 糖 ” 来 处 理 程序 中 的 字典 。 例 如 ,用 花 括号 字典 表达 式 语 
法 和 字典 解析 式 能 够 方便 地 创建 新 的 字典 对 象 


5.1.1 dict 





iI® 


开 ! 


EE 0o 


一 

































































@ 为 了 与 其 他 资料 统一 ， 这 里 将 不 区 分 中 文 语 境 下 的 dict (字典 ) 和 “字典 类 型 的 数据 结构 "， 统 称 为 “字典 ”。 
译 者 注 




















@ 详 见 Python 文档 :“Mapping Types 一 dict”。 











84 第 5 章 ”Python 中 常见 的 数据 结构 





phonebook = { 
oo yy 
Ee A hI 
ala Wr (0) 
} 


ES 


>>> phonebook['alice'] 
93719 


Ses 
Oe lO CA lp ZR a po Dy a 生计 略 寺 


关于 哪些 对 象 可 以 作为 字典 键 ， 有 一 些 限 制 。 

Python 的 字典 由 可 散 列 类 型 "的 键 来 索引 。 可 散 列 对 象 具有 在 其 生命 周期 中 永远 不 会 改变 的 
散 列 值 (参见 hash _), 并 且 可 以 与 其 他 对 象 进行 比较 (参见 ”eq _)。 男 外 ,相等 的 可 散 列 
对 象 ， 其 散 列 值 必然 相同 。 

像 字符 串 和 数 这 样 的 不 可 变 类 型 是 可 散 列 的 , 它们 可 以 很 好 地 用 作 字 典 键 。 元 组 对 象 也 可 以 
用 作 字 典 键 , 但 这 些 元 组 本 身 必须 只 包含 可 散 列 类 型 。 

Python 的 内 置 字典 实现 可 以 应 对 大 多 数 情况 。 字 典 是 高 度 优化 的 ， 并 且 是 Python 语言 的 基 
石 ， 例 如 栈 帧 中 的 类 属性 和 变量 都 存储 在 字典 中 。 

Python 字典 基于 经 过 充分 测试 和 精心 调整 过 的 散 列 表 实 现 , 提供 了 符合 期 望 的 性 能 特征 。 一 
般 情 况 下 ， 用 于 查找 、 插 人、 更 新 和 删除 操作 的 时 间 复 杂 度 都 为 0(1)。 

大 部 分 情况 下 ,应 该 使 用 Python 自 带 的 标准 字典 实现 。 但 是 也 存在 专门 的 第 三 方 字典 实现 ， 
例如 跳跃 表 或 基于 B 树 的 字典 。 

除了 通用 的 aict 对 象 外 ， Python 的 标准 库 还 包含 许多 特殊 的 字典 实现 。 它们 都 基于 内 置 的 
字典 类 ， 基 本 性 能 特征 相同 ， 但 添加 了 其 他 一 些 便 利 特性 。 


下 面 来 逐个 了 解 一 下 。 



















































































能 记 住 键 的 插入 顺序 


collections.OrderedDict” 是 特殊 的 aict 子 类 ,该 类 型 会 记录 添加 到 其 中 的 键 的 插入 
顺序 。 


5.1.2 collections.OrderedDict 

















Q@ 详 见 Python 文档 词汇 表 : “Hashable”。 
@ 一 种 数据 结构 ， 详 见 http://www.cl.cam.ac.uk/teaching/0506/Algorithms/skiplists.pdf。 一 一 译 者 注 
@ 详 见 Python 文 档 :“collections.OrderedDict”。 
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尽管 在 CPython 3.6 及 更 高 版 本 中 ， 标准 的 字典 实现 也 能 保留 键 的 插入 顺序 ， 但 这 只 是 
CPython 实现 的 一 个 副作用 ， 直 到 Python 3.7 才 将 这 种 特性 固定 下 来 了 。" 因 此 ， 如 果 在 自己 的 工 
作 中 很 需要 用 到 键 顺序 ， 最 好 明确 使 用 orderedDict 类 。 

顺便 说 一 句 , orderedDict 不 是 内 置 的 核心 语言 部 分 , 因此 必须 从 标准 库 中 的 collections 
模块 导入 。 


Ennone one ons 

















EEC 
之 过 是 
orsreeDrieetr eon, LT, (El, 2 (omnes Sl 
> 
全 全 于 [9| 
oraderedpee (none eh (Ne a) 
(en e e000 (fe le 
>>> d.keys() 
TREE (0 oneu wo hree 1 ne 









































5.1.3 collections.defaultdict 为 缺失 的 键 返回 默认 值 
defaultaict 是 另 一 个 aict 子 类 ， 其 构造 函数 接受 一 个 可 调用 对 象 ， 查 找 时 如 果 找 不 到 
给 定 的 键 ， 就 返回 这 个 可 调用 对 象 。? 
与 使 用 get () 方 法 或 在 普通 字典 中 捕获 KeyError 异常 相 比 ， 这 种 方式 的 代码 较 少 ， 并 能 
清晰 地 表达 出 程序 员 的 意图 。 





>>> from collections import defaultdict 
三 三) 


# 访问 缺失 的 键 就 会 用 默认 工厂 方法 创建 它 并 将 其 初始 化 
# 在 本 例 中 工厂 方法 为 list1() 


站 

SE oN ce a ei ) 

SS reele ee ee ve he ee ) 
SS "Glo MelSel 

[AG Ge ye ee eb Me hi ese] 


5.1.4 collections.ChainMap 一 一 搜索 多 个 字典 


collections. 


ChainMap 数据 结构 将 多 个 字 








@ 详 见 CPython 邮 和 他 





列表。 








@ 
@ 





tk -k - 














WL Python 文档 : 
见 Python 文档 : 


“collections .defaultdict”。 


“collections .ChainMap”。 


典 分 组 到 一 个 映射 中 , 在 查找 时 逐个 搜索 底层 


A 


钊 9 


86 章 ”Python 中 常见 的 数据 结构 

















映射 ， 直到 找到 一 符合 条 件 的 键 。 对 ChainMap i 进行 插 
的 第 一 个 字典 。 
>>> from collections import ChainMap 
ESS ee = ne 1 No 人 沙 
es 
en nM (le le 
>>> chain 
GeinMao l(t OG WO 2 Ce Ot 
# ChainMap 在 内 部 从 左 到 右 逐 个 搜索 ， 
# 直到 找到 对 应 的 键 或 全 部 搜索 完毕 : 
> eno nseen 
3 
证 
工 
| 
J male re 
5.1.5 types .MappingProxyType 用 于 创建 只 读 字 典 
MappingProxyType 封装 了 标准 的 字典 ， 为 封装 的 字典 数据 提供 只 读 视 
Python 3.3， 用 来 创建 字典 不 可 变 的 代理 版 本 。 














入 、 更 新 和 删除 操作 ， 只 会 作用 于 其 中 


举例 来 说 , 如 果 和 希望 返回 一 
Ee ee 


典 来 表示 类 或 模块 的 内 部 状态 , 同时 禁止 向 该 对 象 写 和 人 内容， 
日 场 。 使 用 MappingProxyType 无 须 创 建 完整 的 字典 副本 。 





>>> from types import Mapping 
>>> writable A 
>>> read_only 


# 代理 是 只 读 的 : 


>>> read_only['one'] 

1 

ps a a 
TypeError: 
"'mappingproxy ' 


# 更 新 原 字 典 也 会 影响 到 代理 : 


"WO 
MappingProxyType (writable) 


ProxylType 
21 


object does not support item assignment” 














rll on 4 
>>> read_only 
ee eon on ce 2 Eo 2) 
5.1.6 ”Python 中 的 字典 : 总 结 
本 节 列 出 的 所 有 Python 字典 实现 都 是 内 置 于 Python 标准 库 中 的 有 效 实 现 。 





Q@ 详 见 Python 文 档 :“ 














types .MappingProxyType 。 
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一 般 情 况 下 ， 建 议 在 自己 的 程序 中 使 用 内 置 的 aict 数据 类 型 。 这 是 优化 过 的 散 列 表 实 现 ， 
功能 多 且 已 被 直接 内 置 到 了 核心 语言 中 。 


如 果 你 有 内 置 aict 无 法 满足 的 特殊 需求 ， 那 么 建议 使 用 本 节 列 出 的 其 他 数据 类 型 。 


虽然 前 面 列 出 的 其 他 字典 实现 均 可 用 ,但 大 多 数 情况 下 都 应 该 使 用 Python 内 置 的 标准 aict， 
这 样 其 他 开发 者 在 维护 你 的 代码 时 就 会 轻松 一 点 。 





























5.1.7 关键 要 点 


口 字典 是 Python 中 的 核心 数据 结构 。 
口 大 部 分 情况 下 ， 内 置 的 aict 类 型 就 足够 了 。 
口 Python 标准 库 提 供 了 用 于 满足 特 丈 需求 的 实现 ， 比 如 只 读 字 典 或 有 序 字典 。 











5.2 ”数组 数据 结构 
大 多 数 编程 语言 中 都 有 数组 这 种 基本 数据 结构 ， 它 在 许多 算法 中 都 有 广泛 的 运用 。 
本 节 将 介绍 Python 中 的 一 些 数组 实现 ， 这 些 数 组 只 用 到 了 语言 的 核心 特性 或 Python 标准 库 

包含 的 功能 。 [二 | 
本 章 还 会 介绍 每 种 实现 的 优 缺点 , 这 样 就 能 根据 实际 情况 选择 合适 的 实现 。 不 过 在 介绍 之 前 ， 

先 来 了 解 一 些 基 础 知识 。 


首先 要 知道 数组 的 原理 及 用 途 。 
数组 由 大 小 固定 的 数据 记录 组 成 ， 根 据 索 引 能 快速 找到 其 中 的 每 个 元 素 。 
因为 数组 将 信息 存储 在 依次 连接 的 内 存 块 中 , 所 以 它 是 连续 的 数据 结构 ( 与 链 式 列 表 等 链 式 
数据 结构 不 同 )。 

现实 世界 中 能 用 来 类 比 数组 数据 结构 的 是 停车 场 。 

停车 场 可 被 视 为 一 个 整体 ， 即 单个 对 象 ， 但 停车 场 内 的 每 个 停车 位 都 有 唯一 的 编号 
索引 。 停 车 位 是 车 辆 的 容器 ,每 个 停车 位 既 可 以 为 室 ， 也 可 以 停 有 汽车 、 摩 托 车 或 其 他 
车 辆 。 
各 个 停车 场 之 间 也 会 有 区 别 。 

有 些 停 车 场 可 能 只 能 停 一 种 类 型 的 车 辆 。 例如， 汽车 停车 场 不 允许 停放 自行 车 。 
这 种 “有 限制 ”的 停车 场 相当 于 “类 型 数组 ”数据 结构 ， 只 允许 存储 相同 数据 类 型 的 
元 素 。 
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在 性 能 方面 , 根据 元 素 的 索引 能 快速 查找 数组 中 对 应 的 元 素 。 合理 的 数组 实现 能 够 确保 索引 
访问 的 耗 时 为 常量 时 间 0(1)。 
Python 标准 库 包 含 几 个 与 数组 相似 的 数据 结构 , 每 个 数据 结构 的 特征 略 有 不 同 。 下 面 来 逐一 


介绍 。 











5.2.1 列表 一 可 变动 态 数组 

列表 是 Python 语言 核心 的 一 部 分 。" 虽 然 名 字 叫 列表 ,但 它 实际 上 是 以 动态 数组 实现 的 。 这 
意味 着 列表 能 够 添加 或 删除 元 素 ， 还 能 分 配 或 释放 内 存 来 自动 调整 存储 空间 。 

Python 列表 可 以 包含 任意 元 素 ， 因 为 Python 中 一 切 丝 为 对 象 ， 连 函数 也 是 对 象 。 因 此 ,不 
同 的 数据 类 型 可 以 混合 存储 在 一 个 列表 中 。 

这 个 功能 很 强大 , 但 缺点 是 同时 支持 多 种 数据 类 型 会 导致 数据 存储 得 不 是 很 紧凑 。 因 此 整个 
结构 占据 了 更 多 的 空间 。” 


> on neu wou seu 
SS ua 
"ome ' 

















列表 拥有 不 错 的 ”repr。 方法 : 


> 
'one', 'two', 'three'] 
列表 是 可 变 的 : 

> dy 

>>> arr 
OMe lao, heey 


el or 
> 
"one', 'three'] 











# 列表 可 以 含有 任意 类 型 的 数据 : 


>>> arr.append (23) 





> 
[elantes FE 8d 
5.2.2 ”元 组 一 一 不 可 变 容器 




















与 列表 一 样 ， 元 组 也 是 Python 语言 核心 的 一 部 分 。 与 列表 不 同 的 是 ，Python 的 元 组 对 象 是 








@ 详 见 Python 文档 : “list”。 

@ 本 质 上 是 因为 列表 中 存储 的 是 PyObject 指针 ， 指 向 不 同 的 对 象 。 然 而 数组 是 直接 存放 数据 本 身 。 后 面 类 似 内 容 
不 再 提醒 ， 还 请 读者 注意 。 一 一 译 者 注 
@) 详 见 Python 文档:“tuple”。 
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不 可 变 的 。 这 意味 着 不 能 动态 添加 或 删除 元 素 ， 元 组 中 的 所 有 元 素 都 必须 在 创建 时 定义 。 


就 像 列表 一 样 ,元 组 可 以 包含 任意 数据 类 型 的 元 素 。 这 有 具有 很 强 的 灵活 性 , 但 也 意味 着 数据 
的 打包 密度 要 比 固定 类 型 的 数组 小 。 











ST On wo ey 
SS ea 
‘one 


# 元 组 拥有 不 错 的 repr_ 方法 : 
SS 
(Oromo Ioan 


# 元 组 是 可 变 的 

SEEGx 

YGE Ls 

"tuple’' object does not support item assignment™" 


| 
TYPeError: 
"'tuple’' object doesn't support item deletion" 


# 元 组 可 以 持 有 任意 类 型 的 数据 : 

# (添加 元 素 会 创建 新 元 组 ) 
过 

(ones a two RS 3 





基本 类 型 数组 

Python 的 array 模块 占用 的 空间 较 少 ， 用 于 存储 C 语 言 风格 的 基本 数据 类 型 ( 如 字 节 、32 
位 整数 ， 以 及 浮 点 数 等 )。 
使 用 array .array 类 创建 的 数组 是 可 变 的 , 行为 与 列表 类 似 。 但 有 一 个 重要 的 区 别 : 这 种 
数组 是 单一 数据 类 型 的 “类 型 数组 ”。” 

由 于 这 个 限制 , 含有 多 个 元 素 的 array .array 对 象 比 列表 和 元 组 节省 空间 。 存 储 在 其 中 的 
元 素 紧 密 排列 ， 因 此 适合 存储 许多 相同 类 型 的 元 素 。 

此 外 ,数组 中 有 许多 普通 列表 中 也 含有 的 方法 , 使 用 方式 也 相同 ,无 须 对 应 用 程序 代码 进行 
其 他 更 改 。 


5.2.3 array.array 




















SS no ne uN 

> a ep Dal dar 7 a A eM ER i I RS ee ee 
| 

EE 





QO 详 见 Python 文档 : “array.array”。 
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# 数组 拥有 不 错 的 ”repr 方法 : 
SS 
| 


# 数组 是 可 变 的 : 


> | 
> 
aed ee 0 sl) 


>>>T0e onl 
Ee 
rE 


>>> arr.append(42.0) 
EE 
Say ee Om 0 ON 





# 数组 中 元 素 类 型 是 固定 的 : 
> rl el 
TypeError: "must be real number, not str" 





5.2.4 str 含有 Unicode 字符 的 不 可 变数 组 


Python 3x 使 用 str 对 象 将 文本 数据 存储 为 不 可 变 的 Unicode 字符 序列 。" 实 际 上 , 这 意味 着 
str 是 不 可 变 的 字符 数组 ,说 来 也 怪 ，str 也 是 一 种 递归 的 数据 结构 ， 字符 串 中 的 每 个 字符 都 是 
长 度 为 1 的 str 对 象 。 


由 于 字符 串 对 象 专注 于 单一 数据 类 型 ， 元 组 排列 紧密 ， 因 此 很 节省 空间 ， 适 合用 来 存储 
Unicode 文本 。 因 为 字符 串 在 Python 中 是 不 可 变 的 ， 所 以 修改 字符 串 需要 创建 一 个 改动 副本 。 最 
接近 “可 变 字符 串 ” 概 念 的 是 存储 单个 字符 的 列表 。 

ey 


> > > 
i 


















































Sa 
"dae 


# 字符 串 是 可 变 的 : 
= 
TypeError: 
"'str' object does not support item assignment”" 


>> del eal 


TyYbpeError: 
"str' object doesn't support item deletion”" 


# 字符 串 可 以 解 包 到 列表 中 ， 从 而 得 到 可 变 版 本 : 





GD 详 见 Python 文档 : “str”。 
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Sy 

Pe Avy 和 eo As | 

> n(n (ol ee 
ORG 


# 字符 串 是 递归 型 数据 类 型 ; 
SS typel DC 
Ws tS 
De ope no 
Sel 


含有 单字 节 的 不 可 变数 组 
bytes 对 象 是 单字 节 的 不 可 变 序 列 ， 单 字 节 为 0~255 ( 含 ) 范围 内 的 整数 。" 从 概念 上 讲 ， 
bytes 与 str 对 象 类 似 ， 可 认为 是 不 可 变 的 字 节 数组 。 


与 字符 串 一 样 ， 也 有 专门 用 于 创建 bytes 对 象 的 字面 语法 ，bytes 也 很 节省 空间 。pytes 
对 象 是 不 可 变 的 ， 但 与 字符 串 不 同 ， 还 有 一 个 名 为 pytearray 的 专用 “可 变 字 节 数 组 ”数据 类 
型 ，bytes 可 以 解 包 到 bytearray 中 。 下 一 节 将 介绍 更 多 关于 bytearray 的 内 容 。 


5.2.5 bytes 























> os (0 I 
| 
A 


# bytes 有 自己 的 语法 : 

> 

lo S00N S00 S02 N30 
有 





# bytes 必须 位 于 0 一 255: 
EL 
ValueEFrror: "bytes must be in range(0, 256)" 


# bytes 是 不 可 变 的 : 

> A i 

TypeError: 

"bytes' object does not support item assignment™" 


>3> del areELLI] 
TYpPeError: 
"'bytes' object doesn't support item deletion" 


5.2.6 bytearray 一 一 含有 单字 节 的 可 变数 组 


pytearray 类 型 是 可 变 整 数 序列 ”, 包含 的 整数 范围 在 0~ 255 ( 含 )。byteartray 与 bytes 
对 象 关系 密切 ,主要 区 别 在 于 pytearray 可 以 自由 修改 , 如 覆盖 、 删 除 现 有 元 素 和 添加 新 元 素 ， 
此 时 pytearray 对 象 将 相应 地 增长 和 缩小 。 











| 详 见 Python 文档 : “bytes”。 
@) 详 见 Python 文档 : “byteartray”。 
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bytearray 数 可 以 转换 回 不 可 变 的 bytes 对 象 ， 但 是 这 需要 复制 所 存储 的 数据 ， 是 耗 时 为 
O(n) 的 慢 操 作 。 


和 
Sa 
水 


# bytearray 的 repr: 
Se 
bytearray(tb MXOONTOTNS02 R03 


# bytearray 是 可 变 的 : 

Sry rl 

Sa 
vteareaw(to OO N00 


pe 
2 


# bytearray 可 以 增长 或 缩小 : 
SS ard 

Se 

bytearray(tb MOO0NXO02\R03 


>>> arr.append (42) 
> 
DvteoarrTav( D0 UNO) 





# bytearray 只 能 持 有 jbyte， 即 位 于 0 一 255 范围 内 的 整数 
后 辣 ee 
TypeError: "an integer is required" 





> > onl:00 
ValueError: "byte must be in range(0, 256)" 


# bytearray 可 以 转换 回 byte 对 象 ， 此 过 程 会 复制 数据 : 
S>> VEes(tarr} 
Ne DN 


5.2.7 关键 要 点 


Python 中 有 多 种 内 置 数据 结构 可 用 来 实现 数组 , 本 节 只 专注 位 于 标准 库 中 和 核心 语言 特性 中 
的 数据 结构 。 


如 果 不 想 局 限于 Python 标准 库 , 那么 从 Numpy 这 样 的 第 三 方 软件 包 中 可 找到 为 科学 计算 和 
数据 科学 提供 的 许多 快速 数组 实现 。 


对 于 Python 中 包含 的 数组 数据 结构 ， 选 择 顺序 可 归结 如 下 。 


如 果 需 要 存储 任意 对 象 ， 且 其 中 可 能 含有 混合 数据 类 型 ,那么 可 以 选择 使 用 列表 或 元 组 , 前 
者 可 变 后 者 不 可 变 。 
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如 果 存 储 数值 (整数 或 浮 点 数 ) 数据 并 要 求 排列 紧密 且 注 重 性 能 , 那么 先 尝试 array .array， 
看 能 否 满足 要 求 。 男 外 可 尝试 准 库 之 外 的 软件 包 ， 如 NumPy 或 Pandas。 


如 果 有 需要 用 Unicode 字符 表示 的 文本 数据 ， 那 么 可 以 使 用 Python 内 置 的 str。 如 果 需 要 
用 到 “可 变 字 符 串 ”， 则 请 使 用 字符 列表 。 


如 果 想 存储 一 个 连续 的 字 节 块 ， 不 可 变 的 请 使 用 pytes， 可 变 的 请 使 用 bytearray。 


总 之 , 在 大 多 数 情况 下 首先 应 尝试 列表 。 如 果 在 性 能 或 存储 空间 上 有 问题 , 再 选择 其 他 专门 
的 数据 类 型 。 一 般 像 列表 这 样 通用 的 数组 型 数据 结构 已 经 能 同时 兼顾 开发 速度 和 编程 便利 性 的 
要 求 了 。 


强烈 建议 在 初期 使 用 通用 数据 格式 ， 不 要 试图 在 一 开始 就 榨 干 所 有 性 能 。 


5.3 记录、 结构 体 和 纯 数据 对 象 
与 数组 相 比 ， 记 录 数 据 结构 中 的 字段 数目 固定 ， 每 个 都 有 一 个 名 称 ， 类 型 也 可 以 不 同 。 


本 节 将 介绍 Python 中 的 记录 、 结 构 体 ， 以 及 “ 纯 数据 对 象 ”"， 但 只 介绍 标准 库 中 含有 的 内 
置 数据 类 型 和 类 。 


顺便 说 一 句 ， 这 里 的 “记录 ”定义 很 宽泛 。 例 如 ， 这 里 也 会 介绍 像 Python 的 内 置 元 组 这 样 
的 类 型 。 由 于 元 组 中 的 字段 没有 名 称 ， 因 此 一 般 不 认为 它 是 严格 意义 上 的 记录 。 


Python 提供 了 几 种 可 用 于 实现 记录 、 结 构 体 和 数据 传输 对 象 的 数据 类 型 。 本 将 快速 介绍 每 
个 实现 及 各 自 特 性 ， 最 后 进行 总 结 并 给 出 一 个 决策 指南 ， 用 来 帮 你 做 出 自己 的 选择 。 


好 吧 ， 让 我 们 开始 吧 ! 





























































































































5.3.1 字典 一 一 简单 数据 对 象 

Python 字典 能 存储 任意 数量 的 对 象 ， 每 个 对 象 都 由 唯一 的 键 来 标识 。 ”字典 也 常常 称 为 映射 
或 关联 数组 ， 能 高 效 地 根据 给 定 的 键 查找 、 插 人 和 删除 所 关联 的 对 象 。 

Python 的 字典 还 可 以 作为 记录 数据 类 型 (record datatype ) 或 数据 对 象 来 使 用 。 在 Python 中 
创建 字典 很 容易 ， 因 为 语言 内 团 了 创建 字典 的 语法 糖 ， 简 洁 又 方便 。 


























Q@ 指 只 含有 数据 本 身 ， 不 含有 业务 逻辑 的 数据 类 型 ， 参 见 https://en.wikipedia.org/wiki/Plain_old_Java_object。 
一 一 译 者 注 

















@) 详 见 Python 文档 “Dictionaries, Maps, and Hashtables” 一 章 。 
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字典 创建 的 数据 对 象 是 可 变 的 , 同时 由 于 可 以 随意 添加 和 删除 字段 , 因此 对 字段 名 称 几 乎 没 


有 保护 措施 。 这 些 特性 综合 起 来 可 能 会 


出 取舍 。 


el 
exo lene 
‘mileage': 
ENO ea 


se 
Se 2 
True, 


1 
reroll 
'mileage': 
vam men 和 


'blue', 
420251. 
False, 


# 字典 有 不 错 的 _ repr 方法 : 


> 

"ero ln Vol eum Mee Vee hte lO I 

# 获取 mileage: 

>>> car2['mileage'] 

本 0 忆 避 让 

# 字典 是 可 变 的 : 

> Cnr eu 

23S CE an ee ls oe 

SE ee 

"ato bd ne oa Sea eee Ln oe 
De Ne Le el il 这 小 


# 对 于 提供 错误 、 缺 失 和 额外 的 字段 名 称 


并 没有 保护 措施 : 


Cl 
Lol ore 
li Ome cule as en 
'windshield': 'broken', 
p 
5.3.2 元 组 一 一 不 可 变 对 象 集合 








Python 元 组 是 简单 的 数据 结构 ， 月 


日 于 对 任意 对 象 进行 分 组 。 





修改 。 
在 性 能 方面 ， 





引入 令 人 惊讶 的 bug， 毕 浣 要 在 便利 性 和 避免 错误 之 间 做 





?元 组 是 不 可 变 的， 创建 后 无 法 


元 组 占用 的 内 存 略 少 于 CPython 中 的 列表 ”， 构 建 速度 也 更 快 。 


从 如 下 反 汇 编 的 字 节 码 中 可 以 看 到 ， 构 造 元 组 常量 只 需要 一 个 LOoaAD_coNST 操作 码 ， 而 构 








GD 详 见 Python 文档 : “tuple”。 
@) 详 见 CPython 源码 : 








tubpleobject.c 和 1istobject.c 
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造 具有 相同 内 容 的 列表 对 象 则 需要 多 个 操作 : 


替换 列表 来 获得 额外 的 性 能 提升 一 般 都 是 人 了 此 途 。 


存储 的 单个 属 








三 


mene os 
eee (erin (u(t 


0 LOAD_CONST a 2s 


3 RETURN_VALUE 


用 
0 LOAD_CONST 
SeeONS 
6 FOADICONSE 
Sa OADECONS 

DUE DSLEST 
15 RETURN_VALUE 








记忆 PO 


ou 


'eval')) 
re 














不 过 你 无 须 过 分 关注 这 些 差 异 。 在 实践 中 这 些 性 能 差异 通常 可 以 忽略 不 计 , 试图 通过 用 元 组 











单纯 的 元 组 有 一 个 潜在 缺点 , 即 存储 在 其 中 的 数据 只 能 通过 整数 索引 来 访问 , 无 法 为 元 组 中 























性 制定 一 个 名 称 ， 从 而 影响 了 代码 的 可 读 性 。 





Tr 


此 外 ,元 组 总 是 一 个 单 例 模 式 的 结构 ,很 难 确保 两 个 元 组 存储 了 相同 数量 的 字段 和 相同 的 


这 样 很 容易 因 琉 忽而 犯错 ， 比 如 弄 错 字段 顺序 。 因 此 ， 建 议 尽 可 能 减少 元 组 中 存储 的 字段 ED| 


Se eol mi le Ceomle ee 
> nl (eo 
Con = (Ce OS 


# 元 组 的 实例 有 不 错 的 _ repr。_ 方法 : 
> ear 

(2 2 alos) 

=> om 

QC Lye 4023 0 alsey 


# 获取 mileage: 
| 
Oe 0 


# 元 组 是 可 变 的 : 
ear 
TypebError: 


"'tuple’' object does not support item assignment™" 


# 对 于 错误 或 额外 的 字段 ， 以 及 提供 错误 的 字段 顺序 ， 并 没有 报错 措施 : 


Seu oes, ele Se es ) 


96 第 5 章 ”Python 中 常见 的 数据 结构 








5.3.3 ”编写 自 定义 类 一 一 手动 精细 控制 
类 可 用 来 为 数据 对 象 定义 可 重用 的 “蓝图 ”( blueprint )， 以 确保 每 个 对 象 都 提供 相同 的 字段 。 





























普通 的 Python 类 可 作为 记录 数据 类 型 ， 但 需要 手动 完成 一 些 其 他 实现 中 已 有 的 便利 功能 。 
例如 ， 向 __init_ 构造 函数 添加 新 字段 就 很 烦琐 上 且 耗 时 。 

此 外 ,对 于 从 自 定 义 类 实例 化 得 到 的 对 象 ， 其 默认 的 字符 串 表 示 形 式 没什么 用 。 解 决 这 个 问 
题 需 要 添加 自己 的 _repr 方法 。? 这 个 方法 通常 很 见长， 每 次 添加 新 字段 时 都 必须 更 新 。 

存储 在 类 上 的 字段 是 可 变 的 , 并 且 可 以 随意 添加 新 字段 。 使 用 @property 装饰 器 ?能 创 
读 字段 ， 并 获得 更 多 的 访问 控制 ， 但 是 这 又 需要 编写 更 多 的 胶水 代码 。 












































ni 
陀 
SS 
/ 





























编写 自 定义 类 适合 将 业务 逻辑 和 行为 添加 到 记录 对 象 中 , 但 这 意味 着 这 些 对 象 在 技术 上 不 再 
是 普通 的 纯 数据 对 象 。 


Sless Car: 
def mn ororn ma Teen Ee: 
SC OO OO 
self.mileage = mileage 
self.automatic = automatic 

















> ee 
> Ga 


= (Ne 

= Cen ol ey 0 Ose) 
# 获取 mileage: 

>>> car2.mileage 

420020 


# 类 是 可 变 的 : 
ee eer 
SS CE 2 aol eo SS Mouee lem 


# 类 的 默认 字符 囊 形式 没 多 大 用 处 ， 必 须 手动 编写 一 个 repr 方法: 
> aul 
Ga 本 SEE 


5.3.4  _ collections .namedtuple 


方便 的 数据 对 象 


自 Python 2.6 以 来 添加 的 namedtuple 类 扩展 了 内 置 元 组 数据 类 型 。 与 自 定义 类 相似 ， 
namedtuple 可 以 为 记录 定义 可 重用 的 “蓝图 ”， 以 确保 每 次 都 使 用 正确 的 字段 名 称 。 





























普通 的 元 组 一 样 , namedtuple 是 不 可 变 的 。 这 意味 着 在 创建 namedtuple 实例 之 后 就 不 能 
添加 新 字段 或 修改 现 有 字段 。 








G@ 详 见 4.2 节 。 
@@ 详 见 Python 文档 : “property”。 
@@ 详 见 4.6 节 。 
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除 此 之 外 , namedtuple 就 相当 于 具有 名 称 的 元 组 。 存 储 在 其 中 的 每 个 对 象 都 可 以 通过 唯一 标 
识 符 访问 。 因 此 无 须 整数 索引 ， 也 无 须 使 用 变通 方法 ， 比 如 将 整数 常量 定义 为 索引 的 助 记 符 。 

namedtuple 对 象 在 内 部 是 作为 普通 的 Python 类 实现 的 , 其 内 存 占 用 优 于 普通 的 类 ,和 普通 元 
组 一 样 高 效 : 


>>> from collections import namedtuple 
>>> from sys import getsizeof 











> 
2 


nen olen On (1 
人 


EECSODNSNI) 
9 
> oe oo 
2 


由 于 使 用 namedtuple 就 必须 更 好 地 组 织 数据 ， 因 此 无 意 中 清 理 了 代码 并 让 其 更 加 易 读 。 

我 发 现 从 专用 的 数据 类 型 (例如 固定 格式 的 字典 ) 切换 到 namedtuple 有 助 于 更 清楚 地 表达 代 
人 码 的 意图 。 通常 ,每 当 我 在 用 namedtuple 重 构 应 用 时 , 都 神奇 地 为 代码 中 的 问题 想 出 了 更 好 的 解 
决 办 法 O 

用 namedtuple 蔡 换 普通 ( 非 结 构 化 的 ) 元 组 和 字典 还 可 以 减轻 同事 的 负担 , 因为 用 namedtuple 
传递 的 数据 在 某 种 程度 上 能 做 到 “ 自 说 明 ”。 


>>> from collections import namedtuple 
>>> Car = namedtuple('Car' , 'color mileage automatic') 
-> Ce NA ees 











实例 有 不 错 的 ”repr。_ 方法 : 
> al 
Car (color='red', mileage=3812.4, automatic=True) 


访问 字段 : 
>>> carl.mileage 
3 2 








字段 是 不 可 变 的 : 

S22 CE ee 2 

AttributeError: "can't set attribute" 
ol ll oe 

A UE EO 

UOT ODIOCL Mc oO CEL eI 








5.3.5 typing.NamedTuple 改进 版 namedtuple 


这 个 类 添加 自 Python 3.6, 是 collections 模块 中 namedtuple 类 的 姊妹 。 ? 它 与 namedtuple 








GD 详 见 Python 文档 :“typing.NamedTuple”。 
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非常 相似 ， 主 要 区 别 在 于 用 新 语法 来 定义 记录 类 型 并 支持 类 型 注解 ( type hint )。 



































注意 ， 只 有 像 mypy 这 样 独立 的 类 型 检查 工具 才 会 在 意 类 型 注解 。 不 过 即使 没有 工具 支持 , 类 























型 注解 也 可 帮助 其 他 程序 员 更 好 地 理解 代码 ( 如果 类 型 注解 没有 随 代码 及 时 更 新 则 会 带 来 混乱 )。 


5.3.6 struct .Struct 











>>> from typing import NamedTuple 


class Car(NamedTuple): 
Coen 
mileage: float 
ne omnes soo 


2 


# 实例 有 不 错 的 repr 方法 : 
ah 
人 


# 访问 字段 : 
>>> carl.mileage 
3 





# 字段 是 不 可 变 的 : 

on maa | 

NE EE Una ee Je eae te 

Se ml Wael leny 

A er US: 

OE OO a lo chal ol /aa 


# 只 有 像 mypy 这 样 的 类 型 检查 工具 才 会 落实 类 型 注解 : 
人 
Canmnleolor= re Tmeage NO onae 0 


序列 化 C 结构 体 
struct .struct 类 "用 于 在 Python 值 和 C 结构 体 之 间 转 换 ， 并 将 其 序列 化 为 Python 字 节 对 





象 。 例 如 可 以 用 来 处 理 存 储 在 文件 中 或 来 自 网 络 连接 的 二 进 制 数 据 。 





结构 体 使 用 与 格式 化 字符 串 类 似 的 语法 来 定义 , 能 够 定义 并 组 织 各 种 C 数 据 类 型 ( 如 char、 





int、 long, 以 及 对 应 的 无 符号 的 变 体 )。 


格式 。 


序列 化 结构 体 一 般 不 用 来 表示 只 在 Python 代码 中 处 理 的 数据 对 象 ， 而 是 主要 用 作 数 据 交换 














在 某 些 情况 下 , 与 其 他 数据 类 型 相 比 , 将 原始 数据 类 型 打包 到 结构 体 中 占用 的 内 存 较 少 。 但 











大 多 数 情 况 下 这 都 属于 高 级 ( 且 可 能 不 必要 的 ) 优化 。 





人 详 见 Python 文档 : “struct.Struct”。 
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SES Tm (aoe DOOR 和 
SoS vv = Semee re 
So atal= Moteuet Dackt23 Tale doa0) 


# 得 到 的 是 一 团 内 存 中 的 数据 : 
> oa 
lun\ sol 00300N S00N 0000N R00 00N S00N R00 


# 数据 可 以 再 次 解 包 : 
>>> MyStruct.unpack (data) 
(2890 e220) 





花哨 的 属性 访问 


这 里 再 介绍 一 种 高 深 的 方法 来 在 Python 中 创建 数据 对 象 : types. SimpleNamespace',。 该 
类 添加 自 Python 3.3， 可 以 用 属性 访问 的 方式 访问 其 名 称 空间 。 


也 就 是 说 ，SimpleNamespace 实例 将 其 中 的 所 有 键 都 公开 为 类 属性 。 因 此 访问 属性 时 可 以 
使 用 obj .key 这 样 的 点 式 语 法 ， 不 需要 用 普通 字典 的 obj ['key ' ] 方 括号 索引 语法 。 所 有 实例 
默认 都 包含 一 个 不 错 的 _ repr_。 


正如 其 名 ，simpleNamespace 很 简单 ， 基 本 上 就 是 扩展 版 的 字典 ， 能够 很 好 地 访问 属性 并 
以 字符 串 打 印 出 来 ， 还 能 自由 地 添加 、 修 改 和 删除 属性 。 


>>> from types import SimpleNamespace 

>>> carl = SimpleNamespace (color='red', 
Te 2 
automatic=True) 


5.3.7 types.SimpleNamespace 




































































# 默认 的 repr 效果 : 
ee 
namespace (automatic=True, color='red', mileage=3812.4) 


# 实例 支持 属性 访问 并 且 是 可 变 的 : 

on leae 1 

SS eu ole ee oem 

el on ome 

| 

namespace (color='red', mileage=12, windshield='broken') 


5.3.8 ”关键 要 点 


那么 在 Python 中 应 该 使 用 哪 种 类 型 的 数据 对 象 呢 ? 从 上 面 可 以 看 到 ，Python 中 有 许多 不 同 
的 方法 实现 记录 或 数据 对 象 ， 使 用 哪 种 方式 通常 取决 于 具体 的 情况 。 


如 果 只 有 两 三 个 字段 , 字段 顺序 易于 记忆 或 无 须 使 用 字段 名 称 ， 则 使 用 简单 元 组 对 象 。 例 如 






































详 见 Python 文档 :“types.SimpleNamespace”。 
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三 维 空间 中 的 (x，Yy，z) 点 。 


如 果 需 要 实现 含有 不 可 变 字 段 的 数据 对 象 ， 则 使 用 collections.namedtuple 或 
typing.NameqTuple 这 样 的 简单 元 组 。 


如 果 想 锁定 字段 名 称 来 避免 输入 错误 ,同样 建议 使 用 collections .namedtuple 和 typing. 


NamedTuple。 
如 果 希 望 保持 简单 ， 建 议 使 用 简单 的 字典 对 象 ， 其 语法 方便 ， 和 JSON 也 类 似 。 


如 果 需 要 对 数据 结构 完全 掌控 ， 可 以 用 eproperty 加 上 设置 方法 和 获取 方法 来 编写 自 定 义 
的 类 。 


如 果 需 要 向 对 象 添加 行为 方法) , 则 应 该 从 头 开 始 编写 自 定 义 类 , 或 者 通过 扩展 collections . 
namedtuple 或 typing.NamedTupl 来 编写 自 定 义 类 。 


如 果 想 严格 打包 数据 以 将 其 序列 化 到 磁盘 上 或 通过 网 络 发 送 ， 建 议 使 用 struct .struct。 


一 般 情况 下 ， 如 果 想 在 Python 中 实现 一 个 普通 的 记录 、 结 构 体 或 数据 对 象 ， 我 的 建议 是 在 
Python 2.x 中 使 用 collections.namedtuple, 在 Python 3 中 使 用 其 妃 妹 typing .NamedTuple。 






























































5.4 ”集合 和 多 重 集合 


本 节 将 用 标准 库 中 的 内 置 数据 类 型 和 类 在 Python 中 实现 可 变 集合 、 不 可 变 集合 和 多 重 集 合 
( 背包 ) 数据 结构 。 首 先 来 快速 回顾 一 下 集合 数据 结构 。 

集合 含有 一 组 不 含 重复 元 素 的 无 序 对 象 。 集 合 可 用 来 快速 检查 元 素 的 包含 性 , 插入 或 删除 值 ， 
计算 两 个 集合 的 并 集 或 交集 。 

在 “合理 ”的 集合 实现 中 ,成 员 检查 预计 耗 时 为 0(1)。 并 集 、 交 集 、 差 集 和 子 集 操作 应 平均 
耗 时 为 O(n)。Python 标准 库 中 的 集合 实现 都 具有 这 些 性 能 指标 。" 

与 字典 一 样 ， 集 合 在 Python 中 也 得 到 了 特殊 对 待 ， 有 语法 糖 能 够 方便 地 创建 集合 。 例 如 ， 
花 括 号 集合 表达 式 语法 和 集合 解析 式 能 够 方便 地 定义 新 的 集合 实例 : 













































































VOWED = en 
ol ee /ee Oe De a rue es 








但 要 小 心 , 创建 空 集 时 需要 调用 set () 构造 函数 。 空 花 括 号 {} 有 歧义 ,会 创建 一 个 空 字典 。 
Python 及 其 标准 库 提供 了 几 个 集合 实现 ， 让 我 们 看 看 。 











Q@ 详 见 wiki.python.org/moin/TimeComplexity。 











5.4.1 set 首选 集合 实现 
set 是 Python 中 的 内 置 集合 实现 。?"set 类 型 是 可 变 的 ， 能 够 动态 插入 和 删除 元 素 。 


Python 的 集合 由 aict 数据 类 型 支持 ， 具 有 相同 的 性 能 特征 。 所 有 可 散 列 ”的 对 象 都 可 以 存 
储 在 集合 中 。 














WE O Ue 
二 
True 


ses ee oieen 

>>> letters.intersection(vowels) 
人 Sn ne 

>>> vowels.add('x') 

>>> vowels 


人 (0 Tr 


>>> len (vowels) 





不 可 变 集合 


frozenset 类 实现 了 不 可 变 版 的 集合 ， 即 在 构造 后 无 法 更 改 。 不 可 变 集合 是 静态 的 ， 只 能 
查询 其 中 的 元 素 ( 无 法 插入 或 删除 )。 因 为 不 可 变 集合 是 静态 的 且 可 散 列 的 ， 所 以 可 以 用 作 字 上 典 
的 键 ， 也 可 以 放置 在 男 一 个 集合 中 ， 普 通 可 变 的 set 对 象 做 不 到 这 一 点 。 


5.4.2 frozenset 



































SS Mom = ee NU re 
>>> vowels.add('p') 
ese oe 


"!'frozenset' object has no attribute 'add’'™”" 


# 不 可 变 集 合 是 可 散 列 的 ， 可 用 作 字 典 的 键 


->> OS (etl el 
> ozone 
‘hello’ 





多 重 集合 


Python 标准 库 中 的 collections .Counter 类 实现 了 多 重 集 合 (也 称 背 包 ，bag ) 类 型 ， 该 
类 型 允许 在 集合 中 多 次 出 现 同一 个 元 素 。” 


如 果 既 要 检查 元 素 是 否 为 集合 的 一 部 分 , 又 要 记录 元 素 在 集合 中 出 现 的 次 数 , 那么 就 需要 用 


5.4.3 collections.Counter 



























































GD 详 见 Python 文档 :“set”。 

@) 详 见 Python 文档 : “hashable”。 

@ 详 见 Python 文档 :“frozenset”。 

由 详 见 Python 文档 :“collections .Counter ”。 
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到 这 个 类 型 。 


SEORNONUESCIIEEEGETONEUIOOREOOEIEESE 
区 ET 区 


Ol WO ea 
>>> inventory.update (loot) 

>>> inventory 

GeUnmeeiaalosesce Sworc 是 划 


Sp mMOrFe oot = Ei aword rt ap ot 

>>> inventory.update (more_loot) 

>>> inventory 

CounEer Ee bread 3 SWOrG .ole :0S) 











Counter 类 有 一 点 要 注意 ,在 计算 counter 对 象 中 元 素 的 数量 时 需要 小 心 。 调 用 len() 返 
回 的 是 多 重 集合 中 唯一 元 素 的 数量 ， 而 想 获取 元 素 的 总 数 需 要 使 用 sum 函数 ; 


>>> len(inventory) 


3 # 唯一 元 素 的 个 数 





>>> sum(inventory.values()) 
6 # 元 素 总 数 


5.4.4 ”关键 要 点 


口 集合 是 Python 及 其 标准 库 中 含有 的 另 一 种 有 用 且 常 用 的 数据 结构 。 
口 查找 可 变 集合 时 可 使 用 内 置 的 set 类 型 。 

口 frozenset 对 象 可 散 列 且 可 用 作 字 典 和 集合 的 键 。 

口 collections.Counter 实现 了 多 重 集合 或 “背包 ”类 型 的 数据 。 


5.5 栈 〈 后 进 先 出 ) 


栈 是 含有 一 组 对 象 的 容器 ， 支 持 快 速 后 进 先 出 《LIFO ) 的 插入 和 删除 操作 。 与 列表 或 数组 不 
同 ， 栈 通常 不 允许 随机 访问 所 包含 的 对 象 。 插 入 和 删除 操作 通常 称 为 入 栈 (push ) 和 出 栈 ( pop )。 


现实 世界 中 与 栈 数据 结构 相似 的 是 一 合 盘 子 。 


新 盘子 会 添加 到 栈 的 顶部 。 由 于 这 些 盘子 非常 宝贵 且 很 重 , 所 以 只 能 移动 最 上 面 的 
盘子 ( 后 进 先 出 )。 要 到 达 栈 中 位 置 较 低 的 盘子 ， 必 须 逐 一 移 除 最 顶端 的 盘子 。 


栈 和 队列 相似 ， 都 是 线性 的 元 素 集合 ， 但 元 素 的 访问 顺序 不 同 。 


从 队列 删除 元 素 时 ， 移 除 的 是 最 先 添加 的 项 〈 先进 先 出 ，FIFO ); 而 栈 是 移 除 最 近 添 加 的 项 
(后 进 先 出 ，LIFO )。 


在 性 能 方面 ,合理 的 栈 实 现在 插入 和 删除 操作 的 预期 耗 时 是 0(1)。 
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栈 在 算法 中 有 广泛 的 应 用 ， 比 如 用 于 语言 解析 和 运行 时 的 内 存 管理 (“调用 栈 ”)。 树 或 图 数 
据 结 构 上 的 深度 优先 搜索 ( DFS ) 是 简短 而 美丽 的 算法 ， 其 中 就 用 到 了 栈 。 


Python 中 有 几 种 栈 实 现 ， 每 个 实现 的 特性 略 有 不 同 。 下 面 来 分 别 介绍 并 比较 各 自 的 特性 。 














5.5.1 列表 简单 的 内 置 栈 


Python 的 内 置 列表 类 型 能 在 正常 的 OG) 时 间 内 完成 人 栈 和 出 栈 操 作 ， 因 此 适合 作为 栈 数据 
结构 。” 


Python 的 列表 在 内 部 以 动态 数组 实现 , 这 意味 着 在 添加 或 删除 时 , 列表 偶尔 需要 调整 元 素 的 
存储 空间 大 小 。 列 表 会 预先 分 配 一 些 后 备 存储 空 间 , 因此 并 非 每 个 人 栈 或 出 栈 操作 都 需要 调整 大 
小 ， 所 以 这 些 操作 的 均 摊 时 间 复 杂 度 为 0(1)。 

这 么 做 的 缺点 是 列表 的 性 能 不 如 基于 链表 的 实现 (如 collections .deque, 下 面 会 介绍 )， 
后 者 能 为 插入 和 删除 操作 提供 稳定 的 O() 时 间 复 杂 度 。 另 一 方面 ， 列 表 能 在 0(1) 时 间 快 速 随机 
访问 堆栈 上 的 元 素 ， 这 能 带 来 额外 的 好 处 。 

使 用 列表 作为 堆栈 应 注意 下 面 几 个 重要 的 性 能 问题 。 

为 了 获得 0(1) 的 插入 和 删除 性 能 ， 必须 使 用 appenag () 方 法 将 新 项 添加 到 列表 的 末尾 ,删除 
时 也 要 使 用 pop () 从 末尾 删除 。 为 了 获得 最 佳 性 能 ， 基 于 Python 列表 的 栈 应 该 向 高 索引 增长 并 
向 低 索 引 缩 小 。 

从 列表 前 部 添加 和 删除 元 素 很 慢 , 耗 时 为 0(n), 因为 这 种 情况 下 必须 移动 现 有 元 素来 为 新 元 
素 腾 出 空间 。 这 是 一 个 性 能 反 模 式 ， 应 尽 可 能 避免 。 
































| 

>>> s.append('eat') 
>>> s.append('sleep') 
>>> s.append('code') 


> 
Feat mm oleepe yy “oode”,] 


> OD 
:Goae 

> Dt() 
'SJeep 
(YY 
"ea 


> 
EO meemols lls 





| 详 见 Python 文档 :“Using lists as stacks”。 
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快速 且 稳 健 的 材 


deque 类 实现 了 一 个 双 端 队列 ， 支 持 在 O(1) 时 间 〈 非 均 摊 ) 从 两 端 添 加 和 移 除 元 素 。 因 为 
双 端 队列 支持 从 两 端 添加 和 删除 元 素 ， 所 以 既 可 以 作为 队列 也 可 以 作为 栈 。” 

Python 的 deque 对 象 以 双向 链表 实现 ， 这 为 搬入 和 删除 元 素 提供 了 出 色 且 一 致 的 性 能 ， 但 
是 随机 访问 位 于 栈 中 间 元 素 的 性 能 很 差 ， 耗 时 为 O0D)。” 


总 之 ， 如 果 想 在 Python 的 标准 库 中 寻找 一 个 具有 链表 性 能 特征 的 栈 数据 结构 实现 ， 那 么 


collections .aqeaue 是 不 错 的 选择 。 





5.5.2 collections.deque 


























>>> from collections import deque 
ES 
s.append('eat') 
>>> s.append('sleep') 
s.append('code') 


deaque([ "eat'., "sleep’'; “code]) 


WO) 
IndexError: "pop from an empty deque" 


为 并 行 计算 提供 锁 语义 

queue .LifoQueue 这 个 位 于 Python 标准 库 中 的 栈 实现 是 同步 的 , 提供 了 锁 语 义 来 支持 多 个 
并 发 的 生产 者 和 消费 者 。” 

除了 LifoQueue 之 外 ，queue 模块 还 包含 其 他 几 个 类 ， 都 实现 了 用 于 并 行 计算 的 多 生产 者 / 
多 用 户 队 列 。 

在 不 同情 况 下 , 锁 语 义 即 可 能 会 带 来 帮助 , 也 可 能 会 导致 不 必要 的 开销 。 在 后 面 这 种 情况 下 ， 
最 好 使 用 1ist 或 deque 作为 通用 栈 。 

>>> from queue import LifoQueue 


OO 
人 





5.5.3 queue.LifoQueue 












































人 详 见 Python 文档 :“collections .qdqeque”。 
@) 详 见 CPython 源码 : _collectionsmodule.c 
@ 详 见 Python 文档 :“aueue.Lifooueue”。 
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Se eu) 
SRSmev at eoderw* 


六 


<queue.LifoQueue object at 0x108298dd8> 


> 
'COde" 
>39 BS Tet() 
Sleep’ 
人 
Le 二 


EN 
Gueue .Empty 





Te 
# 阻塞 ,永远 停 在 这 里 …… 


5.5.4 比较 Python 中 各 个 栈 的 实现 





从 上 面 可 以 看 出 ,Python 中 有 多 种 栈 数据 结构 的 实现 , 各 自 的 特性 稍 有 区 别 , 在 性 能 和 用 途 


上 也 各 有 优 劣 。 


如 果 不 寻 求 并 行 处 理 支 持 (或 者 不 想 手动 处 理 上 锁 和 解锁 )， 可 选择 内 置 列 表 类 型 或 


collections.dequeo 两 者 背后 使 用 的 数据 


结构 和 总 体 易 用 性 有 所 不 同 。 [二 | 











口 列表 底层 是 动态 数组 ， 因 此 适用 于 快速 随机 访问 ， 但 在 添加 或 删除 元 素 时 偶尔 需要 调整 


大 小 。 列 表 会 预先 分 配 一 些 备用 存储 空 











s 间 ， 因 此 不 是 每 个 人 栈 或 出 栈 操作 都 需要 调整 大 


小 , 这 些 操作 的 均 挫 时 间 复 杂 度 为 0(1)。 但 需要 小 心 , 只 能 用 appenda() 和 pop () 从 “ 右 
侧 ” 插 入 和 删除 元 素 ， 否 则 性 能 会 下 降 为 O(n)。 

口 collections.deque 底层 是 双向 链表 ， 为 从 两 端的 添加 和 删除 操作 进行 了 优化 ， 为 这 
些 操作 提供 了 一 致 的 0(1) 性 能 。collections .deque 不 仅 性 能 稳定 ， 而 且 便 于 使 用 ， 
不 必 担 心 在 “错误 的 一 端 ” 添 加 或 删除 项 。 


总 之 ,我 认为 collections .deque 是 在 Python 中 实现 栈 (LIFO 队列 ) 的 绝 佳 选 择 。 





5.5.5 “关键 要 点 














以 避免 性 能 下 降 。 


口 Python 中 有 几 个 栈 实现 ， 每 种 实现 的 尾 
口 collections.deque 提供 安全 且 快 速 的 通用 栈 实 现 。 
口 内 置 列 表 类 型 可 以 作为 栈 使 用 ， 但 要 省 








能 和 使 用 特性 略 有 不 同 。 


\ 心 只 能 使 用 append () 和 pop () 来 添加 和 删除 项 ， 
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5.6 ”队列 先进 先 出 ) 


本 节 将 介绍 仅 使 用 Python 标准 库 中 的 内 置 数据 类 型 和 类 来 实现 FIFO 队列 数据 结构 , 首先 来 
回顾 一 下 什么 是 队列 。 


队列 是 含有 一 组 对 象 的 容器 ， 支 持 快速 插入 和 删除 的 先进 先 出 语义 。 插 人 和 删除 操作 有 时 
称 为 入 队 〈enqueue ) 和 出 队 (dequeue )。 与 列表 或 数组 不 同 ， 队 列 通 常 不 允许 随机 访问 所 包含 
的 对 象 。 


来 看 一 个 先进 先 出 队列 在 现实 中 的 类 比 。 


想象 在 PyCon 注册 的 第 一 天 ， 一 些 Python 高 手 等 着 领取 会 议 徽章 。 新 到 的 人 依次 
进入 会 场 并 排队 领取 徽章 ， 队 列 后 面 会 有 其 他 人 继续 排队 。 移 除 动作 发 生 在 队列 前 端 ， 
因为 开发 者 领取 徽章 和 会 议 礼 品 袋 后 就 离开 了 。 


另 一 种 记 住 队 列 数据 结构 特征 的 方法 是 将 其 视 为 管道 。 


新 元 素 ( 水 分 子 、 乒 乓 球 等 ) 从 管道 一 端 移 向 另 一 端 并 在 那里 被 移 除 。 当 元 素 在 队 
列 中 (想象 成 位 于 一 根 坚 固 的 金属 管 中 ) 时 是 无 法 接触 的 。 唯 一 能 够 与 队列 中 元 素 交互 
的 方法 是 在 管道 后 端 添加 新 元 素 ( 入 队 ) 或 在 管道 前 端 删 除 元 素 ( 出 队 )。 


队列 与 栈 类 似 ， 但 删除 元 素 的 方式 不 同 。 
队列 删除 的 是 最 移 添 加 的 项 〈 先进 先 出 )， 而 栈 删 除 的 是 最 近 添 加 的 项 〈 后 进 先 出 )。 


在 性 能 方面 , 实现 合理 的 队列 在 插入 和 删除 方面 的 操作 预计 耗 时 为 0(1)。 插入 和 删除 是 队列 
上 的 两 个 主要 操作 ， 在 正确 的 实现 中 应 该 很 快 。 

队列 在 算法 中 有 广泛 的 应 用 , 经 常用 于 解决 调度 和 并 行 编程 问题 。 在 树 或 图 数据 结构 上 进行 
宽度 优先 搜索 ( BFS ) 是 一 种 简短 而 美丽 的 算法 ， 其 中 就 用 到 了 队列 。 

调度 算法 通常 在 内 部 使 用 优先 级 队列 。 这 些 是 特 化 的 队列 ,其 中 元 素 的 顺序 不 是 基于 搬 人 时 
间 ， 而 是 基于 优先 级 。 队 列 根据 元 素 的 键 计算 到 每 个 元 素 的 优先 级 。 下 一 节 详 细 介绍 优先 级 队列 
以 及 它们 在 Python 中 的 实现 方式 。 

不 过 普通 队列 无 法 重新 排列 所 包含 的 元 素 。 就 像 在 管道 示例 中 一 样 , 元 素 输入 和 输出 的 顺序 
完全 一 致 。 

Python 中 实现 了 几 个 队列 ， 每 种 实现 的 特征 略 有 不 同 ， 下 面 就 来 看 看 。 
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5.6.1 列表 一 一 非常 慢 的 队列 


普通 列表 可 以 作为 队列 ， 但 从 性 能 角度 来 看 并 不 理想 。 由 于 在 起 始 位 置 搬入 或 删除 元 素 需 
要 将 所 有 其 他 元 素 都 移动 一 个 位 置 ， 因 此 需要 的 时 间 为 O(n)。 


因此 不 推荐 在 Python 中 凑合 用 列表 作为 队列 使 用 〈 除非 只 处 理 少量 元 素 ): 


>>> q = [] 

>>> q.append('eat') 
>>> q.append('sleep') 
>>> q.append('code') 









































汉人 
['eat', 'sleep', 'code'] 


# 小 心 ， 这 种 操作 很 慢 | 


> 0 DOD(OY 
‘eat’' 


快速 和 稳健 的 队列 


aeaue 类 实现 了 一 个 双 端 队列 ,支持 在 O(1) 时 间 ( 非 均 挫 ) 中 从 任 一 端 添加 和 删除 元 素 。 
由 于 aeaue 支持 从 两 端 添加 和 移 除 元 素 ， 因 此 既 可 用 作 队 列 也 可 用 作 栈 。” 


Python 的 aecue 对 象 以 双向 链表 实现 。“ 这 为 插入 和 删除 元 素 提 供 了 出 色 且 一 致 的 性 能 , 但 
是 随机 访问 位 于 栈 中 间 元 素 的 性 能 很 差 ， 耗 时 为 O(n)。 


因此 ， 默 认 情 况 下 collections .deque 是 Python 标准 库 中 不 错 的 队列 型 数据 结构 : 


>>> from collections import deque 
>>> gd = dedque\() 

>>> q.append('eat') 

>>> q.append('sleep') 

>>> q.append('code') 





5.6.2 collections.deque 


























3 
deque(['eat', 'sleep', 'code']) 


SDoDLett ty 
Ede 

>>> q.popleft () 
'SJeep 

> 0 DoDlkeEt() 
:Goae 


>>> q.popleft() 
IndexError: "pop from an empty deque" 








@ 详 
@) 详 见 Python 文档 :“collections .deaue”。 
@ CPython 源码 : _collectionsmodule.c 


见 Python 文档 : “Using lists as queues”。 


让 
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为 并 行 计算 提 供 的 锁 语义 


aueue.oueue 在 Python 标准 库 中 以 同步 的 方式 实现 ,提供 了 锁 语 义 来 支持 多 个 并 发 的 生产 
者 和 消费 者 。" 


queue 模块 包含 其 他 多 个 实现 多 生产 者 /多 用 户 队列 的 类 ， 这 些 队 列 对 并 行 计 算 很 有 用 。 


在 不 同情 况 下 ， 锁 语义 可 能 会 带 来 帮助 ， 也 可 能 会 导致 不 必要 的 开销 。 在 后 面 这 种 情况 下 ， 
最 好 使 用 collections .aqeaue 作为 通用 队列 : 


5.6.3 queue.Queue 




















>>> from queue import Queue 
>>> q = Queue() 

po eg ede 

Sv DU SLeep 

> ee oh es (> 


> 
<Gueue .Oueue object at 0x1070f5b38> 


oy 
'eat! 
>>> q.get() 
ee 
> ty 
"GOde"! 


> emoware (二 
queue.Empty 





St} 
# 阻塞 ,永远 停 在 这 里 …… 





5.6.4 multiprocessing.Queue 共享 作业 队列 


multiprocessing .Queue 作为 共享 作业 队列 来 实现 ， 人 允许 多 个 并 发 worker 并 行 处 理 队列 
中 的 元 素 。 ”由 于 CPython 中 存在 全 局 解释 器 锁 ( GIL )， 因 此 无 法 在 单个 解释 器 进程 上 执行 某 些 
并 行 化 过 程 ， 使 得 大 家 都 转向 基于 进程 的 并 行 化 。 

作为 专门 用 于 在 进程 间 共 享 数据 的 队列 实现 ， 使 用 multiprocessing .Queue 能 够 方便 地 
在 多 个 进程 中 分 派 工作 , 以 此 来 绕 过 GIL 的 限制 。 这 种 类 型 的 队列 可 以 跨 进 程 存储 和 传输 任何 可 
pickle 的 对 象 : 

















>>> from multiprocessing import Queue 
>>> q = Queue() 
> 





人 详 见 Python 文档 :“aqueue.oueue”。 
@) 详 见 Python 文档:“multiprocessing.Queue”。 
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全 
D> on eC 


Ee 
<multiprocessing.queues.Queue object at 0x1081c12b0> 


Ni] 
'eat! 

>>> q.get() 
'SJeep 

> :ety) 
Goeae 


S33 Glo@ele () 
# 阻塞 ,永远 停 在 这 里 …… 


5.6.5 ”关键 要 点 


口 Python 核心 语言 及 其 标准 库 中 含有 几 种 队列 实现 。 

口 列表 对 象 可 以 用 作 队 列 ， 但 由 于 性 能 较 差 ,通常 不 建议 这 么 做 。 

口 如 果 不 需 要 支持 并 行 处 理 ， 那 么 collections .deque 是 Python 中 实现 FIFO 队列 数据 
结构 的 最 佳 选择 。collections .qdeque 是 非常 优秀 的 队列 实现 ， 具 备 期 望 的 性 能 特征 ， 
并 且 可 以 用 作 栈 (LIFO 队列 )。 


5.7 ”优先 队列 


优先 队列 是 一 个 容器 数据 结构 ， 使 用 具有 全 序 关系 的 键 〈 例如 用 数值 表示 的 权重 ) 来 管理 
元 素 ， 以 便 快 速 访问 容器 中 键 值 最 小 或 最 大 的 元 素 。 


优先 队列 可 被 视 为 队列 的 改进 版 ， 其 中 元 素 的 顺序 不 是 基于 插入 时 间 ， 而 是 基于 优先 级 的 。 
对 键 进行 处 理 能 得 到 每 个 元 素 的 优先 级 。 


优先 级 队列 通常 用 于 处 理 调度 问题 ， 例 如 优先 考虑 更 加 紧急 的 任务 。 
来 看 看 操作 系统 任务 调度 器 的 工作 。 























































































































理想 情况 下 ， 系 统 上 的 高 优先 级 任务 ( 如 玩 实 时 游戏 ) 级 别 应 高 于 低 优 先 级 的 任务 
( 如 在 后 台 下 载 更 新 ), 优先 级 队列 将 待 执 行 的 任务 根据 紧急 程度 排列 ,任务 调度 程序 能 
够 快速 选取 并 优先 执行 优先 级 最 高 的 任务 。 





本 节 将 介绍 如 何 使 用 Python 语言 内 置 或 位 于 标准 库 中 的 数据 结构 来 实现 优先 队列 。 每 种 实 
现 都 有 各 自 的 优 缺 点 ， 但 其 中 有 一 种 实现 能 应 对 大 多 数 常见 情况 ， 下 面 一 起 来 看 看 。 











Qa 详 见 维基 百科 “全 序 关系 ”。 
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5.7.1 列表 一 一 手动 维护 有 序 队 列 


使 用 有 序列 表 能 够 快速 识别 并 删除 最 小 或 最 大 的 元 素 ， 缺 点 是 向 列表 搬 人 元 素 表 是 很 慢 的 
O(n) 操 作 。 


虽然 用 标准 库 中 的 bisect .insort" 能 在 O(logn) 时 间 内 找到 插入 位 置 ， 但 缓慢 的 插入 操作 
才 是 瓶颈 。 


向 列表 添加 并 重新 排序 来 维持 顺序 也 至 少 需要 O(nlogn) 的 时 间 。 另 一 个 缺点 是 在 插入 新 元 素 















































时 ， 必 须 手 动 重新 排列 列表 。 人 缺少 这 一 步 就 很 容易 引入 bug， 因 此 担子 总 是 压 在 开发 人 员 身 上 。 
因此 ， 有 序列 表 只 适合 在 插入 次 数 很 少 的 情况 下 充当 优先 队列 。 
& [I 


dq.append((2, 'code')) 
dq.append((1, 'eat')) 
q.append((3, 'sleep')) 


# 注意 : 每 当 添加 新 元 素 或 调用 bisect.insort () 时， 都 要 重新 排序 。 


dq.sort (reverse=True) 


while q: 
es Ee SS Cr ot) 
print (next_item) 


# 结果 : 

# 的 史记 人 人) 
# (2 eeLe 
# (ES 


5.7.2 heapq 一 一 基于 列表 的 二 又 堆 
heapdq 是 二 叉 堆 ， 通 常用 普通 列表 实现 ， 能 在 O(logn) 时 间 内 插入 和 获取 最 小 的 元 素 。” 


heapq 模块 是 在 Python 中 不 错 的 优先 级 队列 实现 。 由 于 heapq 在 技术 上 只 提供 最 小 堆 实 现 ， 
因此 必须 添加 额外 步 又 来 确保 排序 稳定 性 ， 以 此 来 获得 “实际 ”的 优先 级 队列 中 所 含有 的 预期 


特性 。” 


import heapg 

















q= [] 





人 详 见 Python 文档 : “bisect.insort”。 
@) 详 见 Python 文档 :“heapa"。 
y 
@ 详 见 Python 文档 :“heapa - Priority queue implementation notes”。 
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heapq.heappush(q, (2, 'code')) 
heapqd.neappush(q, (1, 'eat')) 
heapq.neappush(q, (3, "Sleep')) 


while q: 
next_item = heapq.heappop (q) 
print (next_item) 


# 结果 : 

由 (ea) 

# (ES 
# (3, "Sleep') 


美丽 的 优先 级 队列 


queue .PriorityQueue 这 个 优先 级 队列 的 实现 在 内 部 使 用 了 heapq, 时 间 和 空间 复杂 度 与 
heapq 相同 。?” 


区 别 在 于 Priorityoueue 是 同步 的 ， 提 供 了 锁 语 义 来 支持 多 个 并 发 的 生产 者 和 消费 者 。 


在 不 同情 况 下 ， 锁 语义 可 能 会 带 来 帮助 ， 也 可 能 会 导致 不 必要 的 开销 。 不 管 哪 种 情况 ， 你 都 
可 能 更 喜欢 Priorityoueue 提供 的 基于 类 的 接口 ,而 不 是 使 用 heapa 提供 的 基于 函数 的 接口 。 





5.7.3 queue.PriorityQueue 












































from queue import PriorityQueue 
q = PriorityQueue() 


ue "eer)) 
Ge 
DSS 


while not q.empty(): 
nesE iEem Ss Goel) 
print (next_item) 


# 结果 : 

# (el OE) 

# (2 CO08 
# (3, "sleep’) 


5.7.4 ”关键 要 点 


口 Python 提供 了 几 种 优先 队列 实现 可 以 使 用 。 

D aueue.Priorityoueue 是 其 中 的 首选 ， 具 有 良好 的 面向 对 象 的 接口 ， 从 名 称 就 能 明白 
其 用 途 。 

口 如 果 想 避免 queue .PriorityQueue 的 锁 开销 ， 那 么 建议 直接 使 用 heapa 模块 。 


























| 详 见 Python 文 档 :“queue.PriorityQueue”。 











循环 和 迭代 








6.1 编写 有 Python 特色 的 循环 


对 于 有 C 语言 风格 背景 的 开发 人 员 ， 若 想 知道 他 们 是 不 是 最 近 才 使 用 Python， 最 简单 的 办 
法 是 观察 他 们 如 何 编写 循环 。 


例如 ， 每 当 我 看 到 类 似 下 面 的 代码 片段 时 ， 就 知道 有 人 试图 用 C 或 Java 的 风格 编写 Python 
代码 : 


Ta od 





















































0 

while i < lenl(my_items): 
print (my_items[i]) 
= 


这 段 代 码 看 上 去 非常 没有 Python 特色 ， 有 以 下 两 点 原因 。 


首先 ， 代 码 中 手动 跟踪 了 索引 i， 先 初始 化 将 其 置 为 零 ， 然 后 在 每 次 循环 迭代 时 仔细 递增 
索引 。 


其 次 ,为 了 确定 迭代 次 数 ， 使 用 len () 获 取 my_items 容器 的 大 小 。 


在 Python 中 编写 的 循环 会 自动 处 理 这 两 个 问题 ， 最 好 善 加 利用 这 一 点 。 例 如 ， 如 果 代码 不 
必 跟 踪 正 在 运行 的 索引 ， 那 么 就 很 难 写 出 意外 的 无 限 循环 ， 同 时 代码 也 更 简洁 、 更 可 读 。 


下 面 来 重 构 第 一 个 代码 示例 , 首先 将 删除 用 于 手动 更 新 索引 的 代码 。 在 Python 中 可 以 用 for 
循环 来 很 好 地 做 到 这 一 点 ， 做 法 是 利用 内 置 的 range () 自动 生成 索引 : 

















>>> range (len(my_items)) 
range (0, 3) 

> a) 
[OO 5 


range 类 型 表示 不 可 变 的 数列 , 内 存 占用 比 普通 列表 少 。range 对 象 实际 上 并 不 存储 数列 的 
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每 个 值 ， 而 是 充当 迭代 器 实时 计算 数列 的 值 。” 
所 以 可 以 利用 *ange () 函数 编写 如 下 所 示 的 内 容 ， 不 用 在 每 次 循环 迭代 时 手动 递增 i: 


for i in range(len(my items)) : 
IT Neenme nn., 


比 之 前 好 一 点 ,但 仍然 不 是 很 有 Python 特色 , 感觉 依然 像 是 一 个 Java 风格 的 迭代 结构 ,而 不 
是 正常 的 Python 循环 。 像 range (len (. ..)) 这 样 的 容器 遍历 方式 通常 可 以 进一步 简化 和 改进 它 。 


正如 前 面 所 提 到 的 ， 在 Python 中 ，for 循环 实际 上 是 for-each 循环 ， 可 以 直接 在 容 圳 或 
序列 中 迭代 元 素 ， 无 须 通过 索引 查找 。 因 此 可 以 用 这 一 点 来 进一步 简化 : 


for item in my_items: 
BE sen 









































这 个 解决 方案 很 有 Python 特色 ， 其 中 使 用 了 几 种 Python 高 级 特性 ， 不 过 仍然 非常 整洁 ， 看 
上 去 就 像 是 在 阅 记 去 编程 教科 书 中 的 伪 代 码 一 样 。 注 意 循环 中 不 再 跟踪 容器 的 大 小 , 也 不 使 用 运行 
时 索引 来 访问 元 素 。 


容器 本 身 现 在 负责 分 发 将 要 处 理 的 元 素 。 如 果 容 器 是 有 序 的 , 那么 所 得 到 的 元 素 序列 也 是 有 
序 的 。 如 果 容 器 是 无 序 的 ， 那 么 将 以 随机 顺序 返回 其 元 素 ， 但 循环 仍然 会 遍历 所 有 元 素 。 


当然 ， 并 不 是 所 有 情况 下 都 能 以 这 种 方式 重 写 循环 。 如 果 需 要 用 到 项 的 索引 ,该 怎么 办 呢 ? 


有 一 种 方法 既 能 让 循环 持 有 当前 运行 的 索引 ， 又 能 避免 前 面 提 到 的 range (len(...)) 模 
式 。 那 就 是 使 用 内 置 的 se 让 其 变 得 具有 Python 特色 : 


>>> for i, item in enumezate (my_ items) : 
a oe (Ce er Mee) 










































































看 到 没 ，Python 中 的 迭代 需 可 以 连续 返回 多 个 值 。 和 迭代 器 可 以 返回 含有 任意 个 元 素 的 元 组 ， 
然后 在 for 语句 内 解 包 。 


这 个 功能 非常 强大 ， 比 如 可 以 使 用 相同 的 技术 同时 迭代 字典 的 键 和 值 : 











So emo = 
'Bob': 'bob@example.com', 
'Alice': 'alice@example.com', 


9 


er em mo mo ne 
print (f'{name} -> {email}') 























Qa 在 Python 2 中 需要 使 用 内 置 的 xrange () 来 获得 这 种 功能 ，Python 2 中 的 range () 会 构造 一 个 列表 对 象 。 


114 第 6 章 循环 和 和 迭代 





'Bopb -> bopbeexampJIe.com 
'Alice -> aliceeexampJIe.com' 


还 有 一 个 例子 ,如 果 一 定 要 编写 一 个 C 风格 的 循环 ,比如 必须 控制 索引 的 步 长 ,该 怎么 办 呢 ? 
假如 有 下 面 这 样 的 Java 循环 : 


EO (lt 




















} 

如 何 将 这 种 模式 转 到 Python 中 ?这 里 要 再 次 用 到 range () 函数 ， 该 函数 接受 可 选 参数 来 控 
制 循环 的 起 始 值 (a )、 终 止 值 Cn ) 和 步 长 (s )。 因 此 前 面 的 Java 循环 示例 可 转换 成 下 面 这 种 
Python 形式 : 





Boe J dasa ee i ee 











关键 要 点 
口 在 Python 中 编写 C 风格 的 循环 非常 没有 Python 特色 。 要 尽 可 能 地 避免 手动 管理 循环 索引 
和 终止 条 件 。 
口 Python 的 for 循环 实际 上 是 for-each 循环 ， 可 直接 在 容器 或 序列 中 的 元 素 上 迭代 。 








6.2 理解 解析 式 

列表 解析 式 是 我 最 喜欢 的 Python 特性 之 一 。 列 表 解 析 式 乍 看 起 来 有 点 神秘 ， 但 在 完全 理解 
之 后 就 会 发 现 其 结构 实际 上 非常 简单 。 

理解 的 关键 在 于 ， 相 比 针对 各 种 容器 的 for 循环 ， 列 表 解 析 式 相当 于 语法 上 更 加 简化 紧凑 
的 改进 版 。 

这 种 东西 有 时 称 为 语法 糖 ， 用 来 快速 完成 一 些 常见 功能 ， 从 而 减轻 了 Python 程序 员 的 负担 。 
来 看 下 面 的 列表 解析 式 


SEE 天 


这 个 解析 式 生 成 一 个 列表 ， 包 含 从 0 到 9 的 所 有 整数 的 平方 : 





























>>> squares 
[WO i de Oe NG 2 So vo eo el 


如 果 想 用 纯 for 循环 构建 相同 的 列表 ， 可 能 会 这 么 写 : 





>>> squares = [] 
(OE: 
squares.append (x * x) 
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这 是 一 个 非常 简单 的 循环 ,对 吧 ? 如 果 回 过 头 来 对 比 for 循环 版 本 和 列表 解析 式 版 本 ,从 中 
会 发 现 一 些 共同 点 进而 总 结 出 一 些 模式 。 归纳 其 中 的 常见 结构 , 最 终 会 得 到 类 似 下 面 这 样 的 模板 : 





values = [expression for item in collection] 
上 面 的 列表 解析 式 “ 模 板 ” 等 价 于 下 面 的 for 循环 : 
Values = [|] 


ToD Teemu elledaons 
values.append (expression) 


这 里 首先 设置 一 个 新 的 列表 实例 来 接受 输出 值 , 然后 遍历 容器 中 的 所 有 元 素 , 用 任意 表达 式 
处 理 每 个 元 素 ， 接 着 将 各 个 结果 添加 到 输出 列表 中 。 


这 是 一 种 固定 模式 ， 可 以 将 许多 for 循环 转换 为 列表 解析 式 ， 反 之 亦 然 。 现 在 再 为 这 个 模 
板 添加 一 个 更 有 用 的 功能 ， 即 使 用 条 件 来 过 滤 元 素 。 


列表 解析 式 可 以 根据 某 些 条 件 过 滤 元 素 , 将 符合 条 件 的 值 添加 到 输出 列表 中 。 来 看 一 个 例子 : 
DEVEnEsousareS EECRRREODRE rin range(Lo) 
0] 
这 个 列表 解析 式 将 得 到 从 0 到 9 所 有 偶数 整数 的 平方 组 成 的 列表 。 它 使 用 取 模 (% ) 运算 符 
返回 两 数 相 除 后 的 余数 ， 在 这 个 例子 中 用 来 测试 一 个 数 是 否 是 偶数 。 这 个 解析 式 能 得 到 预期 的 
结果 : 


>>> even_ squares 
Ow A G0 606 


与 第 一 个 例子 类 似 ， 这 个 新 的 列表 解析 式 可 以 转化 为 一 个 等 价 的 for 循环 : 


even squares = [] 
Ee Se on eevee 
De 
even_squares.append(x * x) 


现在 再 次 尝试 从 这 个 列表 解析 式 和 对 应 的 for 循环 中 归纳 出 转换 模式 。 这 次 需要 向 模板 中 
添加 一 个 过 滤 条 件 用 来 决定 输出 列表 将 要 包含 的 值 。 下 面 是 修改 后 的 列表 理解 式 模板 : 
Values = [expression 


ES oem i rose 
ve ll te 


同样 ， 这 个 列表 解析 式 可 转换 为 下 面 这 种 模式 的 for 循环 : 


values = ll 
rar Weem i Collece nn: 
Ee TC 
values.append (expression) 


这 种 转换 也 很 简单 ,只 是 对 前 面 的 那个 固定 模式 稍 作 改 进 。 希望 这 种 讲解 方式 能 消除 列表 解 
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析 式 的 神秘 感 。 列 表 解 析 式 是 个 有 用 的 工具 ， 所 有 Python 程序 员 都 应 该 掌握 。 
在 继续 之 前 , 需要 指出 的 是 Python 不 仪 支持 列表 解析 式 ， 对 于 集合 和 字典 也 有 类 似 的 语法 糖 
下 面 是 集合 解析 式 : 


S(O 了 
Se(IReds 36 0p O06 0 5) 


















































列表 会 保留 元 素 的 顺序 ， 但 Python 集合 是 无 序 类 型 。 所 以 在 将 元 素 加 到 set 容器 时 顺序 是 
随机 的 。 


下 面 是 字典 解析 式 : 


i (Sy 
0 0 


这 两 种 解析 式 在 实践 中 都 很 有 用 。 不 过 Python 解析 式 中 有 一 个 需要 注意 的 地 方 : 在 熟悉 了 


解析 式 之 后 , 很 容易 就 会 编写 出 难以 阅读 的 代码 。 如 果 不 小 心 的 话 ， 可 能 就 要 面 对 许 多 难以 理解 
的 列表 、 设 置 和 字典 解析 式 。 好 东西 太 多 了 通常 会 适得其反 。 




















在 经 历 了 许多 烦恼 之 后 , 我 给 解析 式 设 定 的 限制 是 只 能 舱 套 一 层 。 在 大 多 数 情况 下 ,多 层 嵌 
套 最 好 直接 使 用 for 循环 ， 这 样 代码 更 加 易 读 且 容易 维护 。 


关键 要 点 


口 解析 式 是 Python 中 的 一 个 关键 特性 。 理 解 和 应 用 解析 式 会 让 代码 变 得 更 具 Python 特色 。 
口 解析 式 只 是 简单 for 循环 模式 的 花哨 语法 糖 。 在 理解 其 中 的 模式 之 后 ， 就 能 对 解析 式 有 
直观 的 理解 。 
口 除了 列表 解析 式 之 外 ， 还 有 集合 解析 式 和 字典 解析 式 。 


6.3 ”列表 切片 技巧 与 寿司 操作 员 

Python 的 列表 对 象 有 方便 的 切片 特性 。 切 片 可 被 视 为 方 括号 索引 语法 的 扩展 , 通常 用 于 访问 
有 序 集合 中 某 一 范围 的 元 素 。 例 如 ， 将 一 个 大 型 列表 对 和 象 分 成 几 个 较 小 的 子 列表 。 

来 看 一 个 例子 ， 切 片 使 用 熟悉 的 [] 索 引 语法 和 如 下 [start :stop:step] 模 式 : 

ee A ce fe 


SS ES 
i | 
















































































# SE lc Gare on seey 
> rl 
[3 号 4 
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[1:3:1] 索 引 返 回 从 索引 1 到 索引 2 的 原始 列表 切片 ， 步 长 为 一 个 元 素 。 为 了 避免 多 算 一 个 
元 素 的 错误 ， 需 要 记 住 切 片 计算 方法 是 算 头 不 算 尾 。 因 此 [1:3:1] 切 片 的 子 列 表 是 [2,3]。 


如 果 不 提 供 步 长 ， 则 默认 为 1: 

的 训 

2 

步 长 〈step ) 参数 也 称 为 步 幅 (stride )， 还 可 用 来 做 其 他 有 趣 的 事情 。 例 如 ， 可 以 创建 一 个 
间隔 包含 原 列 表 元 素 的 子 列 表 : 

> 

| 

很 有 趣 吧 ! 我 喜欢 称 冒 号 分 隔 符 :为 寿司 操作 符 ， 因 为 这 像 是 一 个 从 侧面 切 开 的 美味 太 卷 寿 
司 (makiroll )。 除 了 让 人 想到 美食 和 访问 列表 范围 之 外 ,切片 还 有 一 些 鲜 为 人 知 的 应 用 。 下 面 介 
绍 更 多 有 趣 且 有 用 的 列表 切片 技巧 。 


除了 刚才 看 到 的 使 用 切片 步 长 来 间隔 选择 列表 中 的 元 素 ， 还 有 其 他 用 法 。 比 如 [: :-1] 切 片 
会 得 到 原始 列表 的 逆序 副本 : 

>> numbers[::-1] 

i 

这 里 用 : :让 Python 提供 完整 的 列表 , 但 将 步 长 设置 为 -1 来 从 后 到 前 遍历 所 有 元 素 。 这 种 方 
式 很 整洁 ， 但 在 大 多 数 情 况 下 我 仍然 坚持 使 用 1ist .reverse() 和 内 置 的 reverse () 函数 来 反 
转 列 表 。 


还 有 另 一 个 列表 切片 技巧 ， 即 使 用 :操作 符 清 空 列 表 中 的 所 有 元 素 ， 同 时 不 会 破坏 列表 对 象 6 
本 身 。 


这 适用 于 在 程序 中 有 其 他 引用 指向 这 个 列表 时 清空 列表 。 在 这 种 情况 下 , 通常 不 能 用 新 的 列 
表 对 象 替换 已 有 列表 来 清空 列表 ， 替换 列表 不 会 更 新 原 列表 的 引用 。 此 时 “寿司 操作 符 ” 就 派 上 
用 场 了 : 

> St 

> 人 > et | 


> St 


图 


上 面 的 操作 删除 了 1st 中 的 所 有 元 素 ， 但 保持 列表 对 象 本 身 不 变 。 在 Python 3 中 也 可 以 使 
用 1lst.clear() 完 成 同样 的 工作 ， 这 种 方式 在 某 些 情况 下 可 读 性 更 好 。 但 要 注意 在 Python 2 中 
无 法 使 用 clear ()。 


除了 清空 列表 之 外 ， 切 片 还 可 以 用 来 在 不 创建 新 列表 对 象 的 情况 下 蔡 换 列 表 中 的 所 有 元 素 ， 
即 手动 快速 清空 列表 然后 重新 填充 元 素 : 
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Soniolmalnlete st 
>| | Od 
> 

[Wd 
eds 
[| 
人 
True 


前 面 的 示例 中 蔡 换 了 列表 中 的 所 有 元 素 , 但 并 未 销毁 再 重新 创建 列表 本 身 。 因 此 原始 列表 对 
象 的 旧 引 用 仍然 有 效 。 


“寿司 操作 符 ” 的 男 一 个 作用 是 创建 现 有 列表 的 浅 副本 : 


























SS ereyonnee Ie ee Ieeed 
SS eo ee 
[| 

> opnednml ee 
False 


创建 浅 副 本 意味 着 只 复制 元 素 的 结构 ,而 不 复制 元 素 本 身 。 两 个 列表 中 的 每 个 元 素 都 是 相同 
的 实例 。 


如 果 需 要 复制 所 有 内 容 (包括 元 素 )， 则 需要 创建 列表 的 深 副 本 。 此 时 可 以 使 用 Python 内 置 
的 copy 模块 。 


关键 要 点 


口 “寿司 操作 符 ” 不 仅 可 用 于 选择 列表 中 的 元 素 的 子 列 表 ， 还 可 以 用 来 清除 、 反 转 和 复制 
列表 。 

口 但 要 小 心 ， 许 多 Python 开发 人 员 对 这 个 功能 不 是 非常 了 解 ， 团 队 中 的 其 他 人 可 能 难以 维 
护 用 到 这 些 特性 的 代码 。 


6.4 美丽 的 友 代 咒 


与 许多 其 他 编程 语言 相 比 ， 我 喜欢 美丽 而 清晰 的 Python 语法 。 例 如 低调 的 for-in 循环 ， 
Python 的 美 从 中 得 以 展现 出 来 ， 读 起 来 就 像 英文 句子 那么 自然 : 



































oo = i 2 SH 
GE ee 
oe oe (i) 


但 这 种 优雅 的 循环 结构 在 Python 内 部 是 如 何 工 作 的 ? 循环 如 何 从 正在 循环 的 对 象 中 获取 单 
个 元 素 ? 如 何在 自己 的 Python 对象 中 支持 这 种 编程 风格 ? 


答案 是 在 Python 中 使 用 迭代 器 协议 ， 只 要 对 象 支持 _iter 和 next_ 双 下 划 线 方法 ， 
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那么 就 能 使 用 for-in 循环 。 
与 装饰 器 一 样 ， 返 代 器 及 相关 技术 乍 一 看 可 和 铺 











本 节 中 将 编写 儿 个 支持 迭代 髓 协议 的 Python 类 











照 它 们 来 加 深 对 迭代 顺 的 理解 。 


E 显 得 非常 神秘 和 复杂 ， 


了 这些 


所 以 这 里 分 阶段 逐步 


示例 和 测试 实现 浅显 易 懂 ， 你 可 以 参 





首先 关注 Python 3 中 迭代 器 的 核心 机 制 , 但 这 里 会 避免 牵扯 其 他 无 关内 容 , 以 便 清楚 地 介绍 





迭代 器 的 基本 行为 。 











每 个 例子 最 后 都 会 用 for-in 循环 再 次 实现 。 本 节 最 后 还 将 讨论 迭代 器 在 Python 2 和 了 Python 3 











之 间 的 差异 。 
准备 好 了 吗 ? 证 我 们 开始 吧 ! 





6.4.1 无 限 迭 代 


bl 





首先 编写 一 个 类 来 演示 基本 的 迭代 咒 协 议 。 这 里 使 用 的 示例 可 能 与 你 在 其 他 和 欠 代 器 教程 中 看 
到 的 示例 看 上 去 有 所 不 同 ， 但 不 要 急 ， 因 为 我 认为 这 种 方式 能 更 好 地 介绍 Python 中 迭代 器 的 工 




















作 方 式 。 


接 下 来 的 几 段 内 容 将 实现 一 个 名 为 Repeater 的 类 , 该 类 可 以 通过 for-in 循环 迭代 , 如 下 





所 示 : 


repeater = Repeater('Hello') 
for item in repeater: 
one ls) 























顾名思义 ，Repeater 类 在 迭代 时 类 的 实例 会 重复 返回 同一 个 值 。 因 此 上 面 的 示例 代码 会 一 





直 向 控制 台 输 出 字符 串 'Hello'。 








为 了 进行 实现 ， 首 先 定义 并 填充 Repeater 类 : 


class Repeater: 
ger Lie (selmi aie) 
self.value = value 


qe ot rn Si 瑟 
return RepeaterIterator (self) 




















Repeater 乍 一 看 像 一 个 普通 的 Python 类 ,但 注意 其 中 包含 的 _iter。 双 下 划 线 方法 。 





__iter 创建 并 返回 了 RepeaterIterator 对 象 ,这 


定义 的 辅助 类 : 























是 为 了 实现 for-in 迭代 功能 


必须 
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class RepeaterILerator : 
ei nO: 
self.source = source 


def _ next__(self): 
return self.source.value 


同样 ，RepeaterIterator 看 起 来 像 一 个 简单 的 Python 类 ,但 需要 注意 以 下 两 点 。 


(1) 在 ”init_ 方法 中 ,每 个 RepeaterIterator 实例 都 链接 到 创建 它 的 Repeater 对 象 。 
这 样 可 以 持 有 迭代 的 “ 源 ”( source ) 对 象 。 


(2) 在 RepeaterIterator. next 中 , 回 到 “ 源 ”Repeater 实例 并 返回 与 其 关联 的 值 。 


在 这 个 代码 示例 中 ，Repeater 和 RepeaterIterator 协同 工作 来 支持 Python 的 迭代 器 协 
议 ， 其 中 定义 的 两 个 双 下 划 线 方法 ”iter 和 next 是 让 Python 对 象 欠 代 的 关键 。 


下 面 将 仔细 研究 这 两 个 方法 ， 通 过 对 前 面 介绍 的 代码 进行 一 些 实验 来 了 解 其 中 的 工作 方式 。 


首先 来 确认 这 两 个 类 的 确 能 让 Repeater 对 象 使 用 for-in 循环 迭代 。 为 此 ， 先 创建 一 个 
Repeater 实例 ， 和 迭代 时 该 实例 将 一 直 返 回 字 符 串 'Hello': 


























>>> repeater = Repeater('Hello') 
现在 尝试 用 for-in 循环 遍历 这 个 repeater 对 象 。 运 行 以 下 代码 时 会 发 生 什 么 ? 


>>> for item in repeater: 
ro ne (ren) 











不 错 ， 屏 幕 上 会 显示 很 多 'Hello'。Repeater 不 断 返 回 相 同 的 字符 串 值 ， 因 此 这 个 循环 永 
远 不 会 停止 ， 会 一 直 向 控制 台 打 印 'Hello' : 


Hello 
Hello 
Hello 
Hello 
Hello 





不 过 还 是 林 喜 你 用 Python 编写 了 一 个 可 以 工作 的 选 代 器 ， 并 用 到 for-in 循环 中 。 虽然 特 
环 停 不 下 来 ， 但 还 算 不 错 。 

接 下 来 将 剖析 这 个 示例 ， 了 解 _iter “和 __next ”方法 是 如 何 协同 工作 来 让 Python 对 象 
迭代 的 。 

有 益 的 提示 : 如 果 你 在 Python REPL 会 话 或 终端 中 运行 了 上 面 的 示例 并 且 想 要 停止 , 请 按 几 
次 Cul + C 来 跳出 无 限 循环 。 
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6.4.2 for-in 循环 在 Python 中 的 工作 原理 
现在 已 经 有 了 支持 迭代 器 协议 的 Repeater 类 ， 并 刚刚 运行 了 一 个 for-in 循环 进行 了 验证 : 








repeater = Repeater('Hello') 
for item in repeater: 
oe ae (mics) 


那么 这 个 for-in 循环 在 背后 究竟 做 了 什么 ? 它 如 何 与 repeater 对 象 通信 以 从 中 获取 新 
元 素 ? 


为 了 更 清楚 地 说 明 问 题 ， 来 将 循环 展开 成 一 段 稍 长 但 结果 相同 的 代码 : 


repeater = Repeater('Hello') 
iterator = repeater._ iter _() 
We ee 
ta OT Ml Se LO) 
print (item) 





从 中 可 以 看 到 ，for-in 只 是 简单 while 循环 的 语法 糖 。 








口 首先 让 repeater 对 象 准 备 迭 代 ， 即 调用 iter_ 方法 来 返回 实际 的 迭代 器 对 象 。 
口 然后 循环 反复 调用 迭代 器 对 象 的 _next 方法， 从 中 获取 值 。 


如 果 你 使 用 过 数据 库 的 游标 ,， 那 就 会 熟悉 这 种 概念 模型 : 首先 初始 化 游标 并 准备 读 取 , 然后 
从 中 逐个 取出 数据 存 人 局 部 变量 中 。 


因为 在 同一 时 刻 只 会 有 一 个 元 素 , 所 以 这 种 方法 很 节省 内 存 。 虽 然 这 个 Repeater 类 提供 的 
是 无 限 长 的 元 素 序列 ,但 迭代 起 来 依然 没 问题 。 由 于 无 法 创建 一 个 包含 无 限 个 元 素 的 列表 ， 无 法 
用 Python 列表 模拟 相同 的 行为 ， 因 此 和 迭代 需 是 一 个 非常 强大 的 概念 。 


用 更 抽象 的 术语 来 说 , 迭代 器 提供 了 一 个 通用 接口 , 允许 在 完全 隔离 容器 内 部 结构 的 情况 下 
处 理 容 器 的 每 个 元 素 。 


无 论 是 元 素 列 表 、 字 典 , 还 是 Repeater 类 提供 的 无 限 序列 ， 或 是 其 他 序列 类 型 ， 对 于 迭代 
器 来 说 只 是 实现 细节 不 同 。 和 迭代 器 能 以 相同 的 方式 遍历 这 些 对 象 中 的 元 素 。 


从 上 面 可 以 看 到 , Python 中 的 for-in 循环 没有 什么 特别 之 处 , 在 背后 都 可 以 都 归结 为 在 正 
确 的 时 间 调 用 _iter 和 next 方法。 


实际 上 ， 在 Python 解释 器 会 话 中 可 以 手动 “模拟 ”循环 使 用 迭代 需 协 议 的 方式 : 


>>> repeater = Repeater('Hello') 





































































































>>> iterator = iter (repeater) 
> nex ie 
'Hello’ 


Se na 
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手动 执行 的 结果 与 前 面相 同 ， 每 次 调用 next () 时 ， 迭 代 回 都 会 再 次 发 出 相同 的 问候 语 。 

顺便 说 一 下 ， 这 里 趁机 将 ”iter 和 next 调用 替换 为 Python 的 内 置 函数 iter () 和 
next ( ) 。 

这 些 内 置 函 数 在 内 部 会 调用 相同 的 双 下 划 线 方法 ， 为 迭代 器 协议 提供 一 个 简洁 的 封装 
( facade )， 让 代码 变 得 更 漂亮 、 更 易 读 。 

Python 也 为 其 他 功能 提供 了 封装 。 例 如 len (x) 调 用 了 x. len ,iter(x) 调 用 了 x._ 
iter ，next (x) 调 用 了 x. next  。 

通常 最 好 使 用 内 置 的 封装 函数 , 不 要 直接 访问 实现 协议 的 双 下 划 线 方法 , 这 样 会 让 代码 更 容 
易 阅 读 。 
6.4.3 ”更 简单 的 迭代 器 类 

到 目前 为 止 的 迭代 器 示例 由 两 个 独立 的 类 Repeater 和 RepeaterIterator 组 成 ， 直 接 对 
应 于 Python 迭代 器 协议 使 用 的 两 个 阶段 。 

首先 是 调用 iter () 设置 和 获取 迭代 需 对 象 ， 然 后 通过 next () 不 断 从 迭代 器 中 获取 值 。 

大 部 分 情况 下 ， 这 两 步 可 以 放 到 一 个 类 中 ， 用 这 种 方式 实现 基于 类 的 迭代 器 代码 较 少 。 

之 前 的 第 一 个 例子 中 没有 这 样 做 , 因为 分 开 介绍 能 理 清 迭 代 器 协议 背后 的 概念 模型 。 现 在 既 
然 已 经 明白 了 如 何 用 烦琐 的 方法 编写 一 个 基于 类 的 迭代 器 ， 那 么 是 时 候 来 简化 了 。 

记得 为 什么 还 要 使 用 RepeaterIterator 类 吗 ? 因 为 要 用 到 这 个 类 中 的 __next_ 方法 ， 
以 便 从 过 代 器 中 获取 新 值 。 不 过 在 哪里 定义 next。 并 不 重要 。 在 迭代 器 协议 中 ， 最 重要 的 是 
_iter 要 返回 带 有 next _ 方法 的 对 象 。 
这 就 诞生 了 一 个 想法 : RepeaterIterator 不 断 返回 相同 的 值 ， 且 不 必 跟 踪 任 何 内 部 状态 。 
能 和 否 直 接 将 _ next ”方法 添加 到 Repeater 类 中 呢 ? 

这 样 就 可 以 完全 摆脱 RepeaterIterator， 用 一 个 Python 类 就 能 实现 一 个 可 迭代 的 对 象 。 
来 尝试 一 下 ， 简 化 后 的 迭代 器 示例 如 下 所 示 : 

Class Repeater: 


le on (ls: 
self.value = value 













































































那么 
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人 
return self 


def _ next__(self): 
return self.value 





从 含有 两 个 类 的 10 行 代码 简化 成 了 只 有 一 个 类 的 7 行 代 码 ， 而 简化 后 的 实现 仍然 支持 迭代 
器 协议 : 
>>> repeater = Repeater('Hello') 


>>> for item in repeater: 
print (item) 


Hello 
Hello 
Hello 


以 这 种 方式 简化 前 面 基于 类 的 迭代 器 通常 没有 问题 。 事 实 上 ， 大 多 数 Python 迭代 器 教 程 都 
是 直接 以 这 种 方式 开始 介绍 , 但 我 始终 认为 从 一 开始 就 用 一 个 类 来 解释 会 隐藏 迭代 器 协议 的 基本 
原理 ,增加 了 理解 的 难度 。 








6.4.4 不 想 无 限 迭 代 


现在 你 应 该 很 好 地 掌握 了 Python 中 迭代 器 的 工作 原理 ， 但 是 到 目前 为 止 只 实现 了 无 限 和 迭代 
的 迭代 器 。 
显然 ,Python 中 的 迭代 器 主要 不 是 为 了 无 限 重复 。 
下 面 这 个 示例 来 激发 大 家 的 学 习 兴 


oe ,2 
在 ES 从 二 
TIE (a) 























hl 


丰 实 上 ， 回 顾 本 节 开 头 会 发 现 ,我 使 用 了 





你 理所当然 地 期 望 这 段 代码 输出 数字 1、2 和 3 后 停止 ， 而 不 是 在 终端 窗口 中 看 到 3 在 不 断 
刷 屏 ， 然 后 在 慌乱 中 狂 按 Ctrl + C 来 终止 程序 。 





所 以 现在 来 学 习 如 何 编写 一 个 会 生成 新 值 , 并 且 最 终 会 停 下 来 的 迭代 器 。 一般 情况 下 Python 
对 象 也 不 会 在 for-in 循环 中 无 限 迭 代 。 

现在 来 编写 另 一 个 名 为 BoundedRepeater 的 迭代 器 类 ， 这 个 类 与 之 前 的 Repeater 示例 
类 似 ， 但 这 个 类 需要 能 在 重复 特定 次 数 后 停止。 


稍微 思考 一 下 应 该 如 何 做 到 这 一 点 。 和 迭代 器 如 何 表明 已 执行 完毕 , 没有 元 素 可 供 迭 代 了 呢 ? 
你 也 许 会 想 : “可 以 从 ”next_ 方法 中 返 回 None。” 





这 个 主意 不 错 , 但 问题 在 于 如 果真 的 希望 有 些 迭 代 咒 返回 None 该 怎么 办 ? 
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来 看 看 其 他 Python 迭代 顺 是 如 何 解 决 这 个 问题 的 。 首 先 来 构建 一 个 简 自 
个 元 素 的 列表 ， 然 后 遍历 这 个 列表 直到 耗 尽 所 有 元 素 ， 观 察 最 后 会 发 生 什 么 : 














= 
ol (my 
> (Eeror) 

下 

0 

2 

eo) 

3 


的 容器 ， 即 包含 几 


注意 , 现在 已 经 消耗 了 列表 中 的 所 有 三 个 可 用 元 素 ， 来 观察 再 次 在 迭代 器 上 调用 next 会 发 


生 什 么 情况 : 


nee en 
StopIteration 


啊 哈 ! 引发 了 StopIteration 异常 ， 表示 已 经 耗 尽 了 迭代 器 中 的 所 有 可 月 


日 值 。 








没 错 ， 和 迭代 器 使 用 异常 来 处 理 控 


的 StopIteration 异常 。 





判 流 。 为 了 表示 迭代 结束 ，Python 送 代 器 会 





简单 地 抛 出 内 置 





日 昌 


及 





如 果 一 直 向 迭代 
可 供 迭 代 : 


Ee (en 
StopIteration 
et ) 
StopIteration 








了 99 














Python 迭代 器 通常 不 能 “ 重 置 





Ly 





求 更 多 的 值 ， 就 会 不 断 抛 出 stopIteration 异常 , 表示 没有 更 多 的 值 


如 果 其 中 的 元 素 已 经 耗 尽 ， 那 么 每 次 调用 next () 时 都 会 


引发 StopIteration。 若 想 重 新 迭代 ， 需 要 使 用 iter () 函数 获取 一 个 新 的 迭代 器 对 象 。 





对 于 编写 在 重复 一 定 次 数 后 能 停 


class BoundedRepeater: 
ET 
self.value value 
self.max_repeats = max_repeats 
self.Count 0 


max_repeats): 


(es 
return self 


def _ next__(self): 
if self.count >= self.max_ repeats: 
raise StopIteration 
全 臣民 OU te 
return self.value 





止 挝 代 的 BoundedRepeater 类 ， 现 在 万 事 俱 备 : 
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这 个 实现 的 结果 符合 预期 ， 迭 代 在 达到 max_repeats 参数 中 定义 的 次 数 后 停止 : 


>>> repeater = BoundedRepeater('Hello', 3) 
> em eee 
oe (Pliesm) 
Hello 
Hello 
Hello 


如 果 重 写 上 一 个 for-in 循环 的 例子 , 移 除 一 些 语法 糖 , 那么 展开 后 最 终 会 得 到 下 面 的 代码 
片段 : 


repeater = BoundedRepeater('Hello', 3) 
Eenrnalteorn eer (neoeale, 
while True: 
Bs 
em ne (en een 
except StopIteration: 
break 
print (item) 





每 次 在 此 循环 中 调用 next () 时 都 会 检查 stopIteration 异常 ， 并 在 必要 时 中 断 while 
循环 。 

用 3 行 的 for-in 循环 替换 8 行 的 while 循环 是 个 不 错 的 改进 ， 能 让 代码 更 加 易 读 和 维护 。 
这 样 从 另 一 方面 看 出 了 Python 迭代 器 的 强大 之 处 。 














6.4.5 Python 2.Xx 兼 容 性 


前 面 展示 的 所 有 代码 示例 都 是 用 Python 3 编写 的 。 当 涉及 实现 基于 类 的 迭代 器 时 ，Python 2 
和 Python 3 之 间 存 在 一 个 小 但 重要 的 区 别 。 


口 在 Python 3 中 ， 从 迭代 器 中 获取 下 一 个 值 的 方法 名 为 next。 。 
口 在 Python 2 中， 相同 的 方法 名 为 next (不 带 下 划 线 )。 


如 果 你 正在 编写 基于 类 的 迭代 器 并 试图 同时 支持 Python 2 和 Python 3,， 那么 这 种 命名 差异 会 
产生 一 些 肪 烦 。 季 运 的 是 ， 有 一 种 简单 的 方法 可 以 解决 这 个 问题 。 


下 面 是 改进 后 的 InfiniteRepeater 类 ， 可 同时 在 Python 2 和 Python 3 上 运行 : 

































































class InfiniteRepeater (object) : 
Ce (fe 
self.value = value 


ole oe (Se le) 
return self 


def _ next__(self): 
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return self.value 


# Python 2 兼容 性 : 
def next (self): 
ee STEEL 


为 了 使 这 个 迭代 器 类 与 Python 2 兼容， 我 做 了 下 面 两 处 小 改动 。 


首先 添加 了 一 个 next 方法 ,简单 地 调用 并 返回 原 ” next 的 结果 。 基 本 上 就 是 为 现 有 的 
__next 实现 创建 一 个 别名 以 便 让 Python 2 找到。 这样 就 可 以 支持 两 个 版 本 的 Python， 同 时 所 
有 实际 的 实现 细节 仍然 位 于 一 个 函数 中 。 


其 次 , 将 类 定义 修改 为 从 object 继承 ,以 确保 在 Python 2 上 创建 的 是 新 式 类 。 这 与 迭代 顺 
没有 关系 ， 不 过 是 一 个 很 好 的 习惯 。 









































6.4.6 ”关键 要 点 


口 迭代 器 为 Python 对 象 提 供 了 一 个 序列 接口 ， 占 用 的 内 存 较 少 晶 具有 Python 特色 ， 以 此 来 
支持 for-in 循环 之 美 。 

口 为 了 支持 迭代 ， 对 象 需要 通过 提供 ”iter 和 next _ 双 下 划 线 方法 来 实现 迭代 器 
协议 。 

口 基于 类 的 迭代 器 只 是 用 Python 编写 可 迭代 对 象 的 一 种 方法 。 可 迭代 对 象 还 包括 生成 吉 和 

















6.5 生成 器 是 简化 版 迭代 器 

我 们 在 6.4 节 花 了 很 多 时 间 编 写 基 于 类 的 迭代 需 。 从 教学 的 角度 来 看 还 行 ， 不 过 从 例子 中 可 
以 看 出 ， 编 写 这 种 迭代 器 类 需要 大 量 样板 代码 。 说 实话 ， 作 为 一 个 “懒惰 ”的 开发 者 ， 我 不 喜欢 
烦琐 而 重复 的 工作 。 

不 过 迭代 器 在 Python 中 非常 有 用 ， 能 够 编写 漂亮 的 for-in 循环 ， 让 代码 更 有 Python 特色 
且 高 效 。 如 果 有 一 种 更 方便 的 方式 来 编写 这 些 迭 代 吕 就 好 了 了 …… 

好 消息 是 真 的 有 这 样 的 方法 ! Python 又 提供 了 一 些 语法 糖 来 简化 迭代 器 的 编写 。 本 节 将 介绍 
如 何 使 用 生成 器 和 yiela 关键 字 以 较 少 的 代码 快速 编写 迭代 顺 。 



























































6.5.1 无 限 生成 器 


让 我 们 首先 回顾 一 下 之 前 用 来 介绍 迭代 器 思想 的 Repeater 示例 。 这 个 类 实现 了 一 个 基于 类 
的 无 限 循 环 的 迭代 器 ， 简 化 版 的 Repeater 类 如 下 所 示 : 
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class Repeater: 
or ne (ee, Saves)3 
self.value = value 


Ger 1 Sel 
return self 


def _ next__(self): 
return self.value 


的 确 , 对 于 这 样 简单 的 迭代 器 来 说 代码 有 点 多 了 。 这 个 类 中 的 某 些 部 分 似乎 相当 规整 ,每 个 
基于 类 的 迭代 器 好 像 都 是 这 么 写 的 。 


此 时 Python 生成 器 就 派 上 用 场 了 。 如 果 将 前 面 的 迭代 融 类 重 写 为 生成 家 ， 看 起 来 是 这 样 的 : 

















def repeater (value) : 
We ee: 
yield value 


从 7 行 代码 缩短 到 3 行 ,不 错 吧 ? 从 中 可 以 看 出 ,生成 器 看 起 来 像 普通 函数 ,但 它 没有 return 
语句 ， 而 是 用 viela 将 数据 传 回 给 调用 者 。 
这 个 新 的 生成 器 实现 是 否 仍然 像 基 于 类 的 迭代 器 一 样 工 作 ” 让 我 们 用 for-in 循环 测试 一 下 : 


1 
TOORTIELOS 























pp 
Bi 
不 
Et 


HI 

代码 能 正常 工作 , 但 依然 是 无 限 循环 输出 问候 语 。 这 个 简短 的 生成 器 实现 似乎 与 Repeater 
类 相同 。( 如 果 想 在 解释 器 会 话 中 跳出 无 限 循环 ， 请 按 Ctrl + C。 ) 

那么 生成 器 是 如 何 工作 的 呢 ? 生成 器 看 起 来 像 普通 机 数 , 但 行为 完全 不 同 。 提 醒 一 下 初学 者 ， 
调用 生成 器 函数 并 不 会 运行 该 函数 ， 仅 仅 创建 并 返回 一 个 生成 器 对 象 : 


>>> repeater('Hey') 
<generator object repeater at 0x107bcdqbf8> 


只 有 在 对 生成 器 对 象 上 调用 next () 时 才 会 执行 生成 器 函数 中 的 代码 : 



























































>>> generator_obj = repeater('Hey') 
>>> next (generator_obj) 
:Hey， 








如 果 细 看 repeater 函数 的 代码 ， 就 会 发 现 yiela 关键 字 像 是 在 茶 种 程度 上 停止 这 个 生成 
器 函数 的 执行 ， 然 后 在 稍 后 的 时 间 点 恢复 : 
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def repeater (value) : 
while True: 
yield value 


这 种 心智 模型 很 符合 实际 情况 。 当 函数 内 部 调用 return 语句 时 , 控制 权 会 永久 性 地 交还 给 
函数 的 调用 者 。 在 调用 yiela 时 ， 虽 然 控制 权 也 是 交还 给 函数 的 调用 者， 但 只 是 暂时 的 。 


return 语句 会 丢弃 图 数 的 局 部 状态 ， 而 yield 语句 会 暂停 该 函数 并 保留 其 局 部 状态 。 实 际 
上 ,这 意味 着 局 部 变量 和 生成 吉 函 数 的 执行 状态 只 是 暂时 隐藏 起 来 ,不 会 被 完全 抛弃 。 再 次 调用 
生成 需 的 next () 能够 恢复 执行 函数 : 
>>> iterator = repeater('Hi') 
三 EDITOEEE SEO 
"Hi r 
Ee (te ne 
‘Hi 下 
SES oe (eae) 
'Hi 下 
这 使 得 生成 器 完全 兼容 迭代 器 协议 ， 因 此 我 喜欢 将 生成 絮 看 作 主 要 用 来 实现 迭代 器 的 语 
法 糖 。 


对 于 大 多 数 类 型 的 迭代 器 来 说 ， 编 写生 成 器 函数 比 定义 元 长 的 基于 类 的 迭代 器 更 容易 且 更 
易 读 。 


6.5.2 ”能 够 停 下 来 的 生成 器 


本 节 开 始 时 又 编写 了 一 个 无 限 生成 器 。 现在 你 可 能 想 知道 如 何 编写 能 够 在 一 段 时 间 后 停 下 来 
的 生成 器 ， 而 不 是 一 直 运行 下 去 。 


回忆 一 下 , 在 基于 类 的 迭代 器 中 , 可 以 通过 手动 引发 StopIteration 异常 来 表示 迭代 结束 。 
为 生成 带 与 基于 类 的 迭代 器 完全 兼容 ， 所 以 背后 仍然 使 用 这 种 方法 。 


幸运 的 是 , 程序 员 现 在 可 以 使 用 更 好 的 接口 。 如 果 控 制 流 从 生成 右 函 数 中 返回 , 但 不 是 通过 
yield 语句 ， 那 么 生成 能 就 会 停止 。 这 意味 着 不 必 再 抛 出 StopIteration 了 。 


来 看 一 个 例子 : 


def repeat_three times (value) : 
yield value 
yield value 
De ede 


注意 这 个 生成 器 函数 中 没有 循环 , 只 是 简单 地 包含 了 三 条 yield 语句 。 如果 yiela 暂时 
中 止 函 数 的 执行 并 将 值 传递 给 调用 者 ， 那 么 当 到 达 该 生成 器 的 末尾 时 会 发 生 什 么 ”让 我 们 来 
看 看 : 
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>>> for x in repeat_ three times('Hey there') : 
Brieles 


'Hey there' 'Hey 
there' 'Hey 
there' 





你 可 能 已 经 预料 到 , 该 生成 右 在 迭代 三 次 后 停止 产生 新 值 。 我 们 可 以 假设 这 是 通过 当 执 行 到 
函数 结尾 时 引发 StopIteration 异常 来 实现 的 。 通 过 男 一 个 实验 来 确认 一 下 : 


>>> iterator = repeat_ three times('Hey there') 
SS Mp lena) 

'Hey there’' 
eee) 
‘Hey there' 
Ee (eee. 
'Hey there' 
> ne ero 
StopIteration 
ne (ee 
StopIteration 














这 个 迭代 器 表现 得 和 预期 的 一 样 。 一 旦 到 达 生 成 器 函数 的 末尾 ， 就 会 不 断 抛 出 StopIteration 
以 表示 所 有 值 都 用 完了 。 


回 到 6.4 节 的 男 一 个 例子 。BoundedIterator 类 实现 了 一 个 只 会 重复 特定 次 数 的 迭代 髓 : 


class BoundedRepeater: 
def _ init _(self, value, max_repeats): 
self.value = value 
self.max_repeats = max_repeats 
sedeseounmtee = 





oer ie sel DD 
return self 





def _ next__(self): 
if self.count >= self.max_ repeats: 
raise StopIteration 
Selmseoume = 


return self.value 

















为 什么 不 尝试 以 生成 器 函数 重新 实现 这 个 BoundedRepeater 类 呢 ?” 下 面 是 第 一 次 尝试 : 


def bounded repeater (value, max_ repeats): 
Gomme = 9 
WS es 
if count >= max_repeats: 
return 
(everame := 
yield value 


由 于 想 演 示 在 生成 器 中 使 用 return 语句 会 终止 迭代 并 产生 stopIteration 异常 ,因此 这 
个 函数 中 的 while 循环 有 点 笨拙 。 后 面 很 快 会 整理 并 简化 这 个 生成 器 函数 ， 但 先 尝 试 一 下 目前 
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的 代码 : 


SS fOr x ounded repeacder (er 4 : 
ode (Se) 


‘Hi r 

'Hi r 

'Hi 了 

Hi r 

很 好 ， 现 在 有 一 个 能 重复 特定 次 数 后 终止 的 生成 器 。 它 使 用 yiela 语句 传 回 值 ， 直 到 碰 到 
return 语句 后 停止 迭代 。 


就 像 刚刚 说 的 那样 ， 这 个 生成 器 可 以 进一步 简化 。 利 用 Python 为 每 个 函数 的 末尾 添加 一 个 
隐 式 return None 语句 的 特性 ， 我 们 来 编写 下 面 这 个 最 终 版 : 
def bounded repeater (value，max_repeats) : 


for i in range (max_ repeats): 
yield value 











可 以 确定 , 简化 后 的 生成 器 仍然 以 相同 的 方式 工作 。 所 有 方面 都 考虑 到 了 , 从 BoundedRepeater 
类 中 的 12 行 实现 转 到 了 基于 生成 器 的 3 行 实现 ， 功 能 完全 相同 ， 同 时 代码 行 数 减 少 了 75%， 还 
不 赖 吧 ! 


正如 刚才 看 到 的 ， 与 编写 基于 类 的 迭代 器 相 比 ， 生 成 器 能 帮助 “抽象 出 ”大 部 分 样板 代码 ， 
减轻 程序 员 的 负担 ， 从 而 编写 出 更 简短 和 易于 维护 的 迭代 器 。 生 成 器 函数 是 Python 中 的 一 个 重 
要 特性 ， 应 该 毫 不 犹 殉 地 应 用 到 自己 的 程序 中 。 


6.5.3 ”关键 要 点 


D 生成 器 函数 是 一 种 语法 精 ， 用 于 编写 支持 迭代 器 协 议 的 对 象 。 与 编写 基于 类 的 移 代 器 相 
比 ， 生 成 器 能 抽象 出 许多 样板 代码 。 

口 yielg 语句 用 来 暂时 中 止 执行 生成 器 函数 并 传 回 值 。 

口 在 生成 器 中 ， 控 制 流通 过 非 yield 话 句 离开 会 抛 出 stopInteration 异常 。 


6.6 生成 器 表达 式 


随 着 深入 了 解 并 在 代码 中 以 不 同 的 方法 实现 Python 迭代 器 协议 后 ,我 意识 到 “语法 糖 ” 是 
一 个 不 断 出 现 的 主题 。 


你 已 经 看 到 ， 基 于 类 的 迭代 器 和 生成 器 函数 在 底层 都 使 用 了 相同 的 设计 模式 。 


生成 器 函数 能 够 用 来 快速 在 代码 中 支持 迭代 器 协议 , 与 基于 类 的 迭代 器 相 比 省 去 了 大 量 烦 珊 
的 工作 。 这 些 特殊 的 语法 或 语法 糖 既 节省 了 时 间 ， 又 减轻 了 开发 人 员 的 工作 负担 。 
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这 种 情况 在 Python 和 其 他 编程 语言 中 不 断 出 现 。 在 程序 中 使 用 某 个 设计 模式 的 人 越 多 , 语 
言 创建 者 就 越 有 可 能 将 这 个 设计 模式 抽象 出 来 并 提供 快捷 的 实现 。 


程序 设计 语言 就 这 样 随 着 时 间 不 断 演变 。 开 发 者 从 中 受益 ,得 到 越 来 越 强大 的 组 件 , 减少 了 
烦琐 的 工作 ， 从 而 在 更 短 的 时 间 内 实现 更 多 的 功能 。 

从 之 前 章节 可 以 看 出 , 生成 右 为 编写 基于 类 的 迭代 带 提 供 了 语法 糖 。 本 节 将 介绍 的 生成 器 表 
达 式 则 在 此 之 上 又 添加 了 一 层 语 法 糖 。 

生成 絮 表 达 式 能 够 更 方便 地 编写 迭代 带 , 看 起 来 像 是 简化 后 的 列表 解析 式 语法 。 生 成 器 表达 
式 用 一 行 代码 就 能 定义 迭代 器 。 

来 看 一 个 例子 : 


eee SS Mule le HRN er di ecu are re sa) ) 


迭代 完成 后 ， 这 个 生成 器 表达 式 产 生 的 值 序列 与 前 一 节 中 的 bounded_repeater 生成 需 函 
数 相 同 。 这 里 再 次 把 boundeqd_repeater 列 出 来 以 防 你 忘记 了 : 




































































def bounded repeater (value, max_ repeats): 
for i in range(max_ repeats): 
yield value 
iterator = bounded repeater('Hello', 3) 
从 代码 量 上 来 看 ， 生 成 器 函数 需要 4 行 , 基于 类 的 迭代 器 需要 更 多 ,而 现在 生成 器 表达 式 只 
要 1 行 , 很 7 不 起 吧 ! 
但 这 里 走 得 太 快 了 ， 先 脚踏实地 ， 确 保生 成 器 表达 式 定 义 的 迭代 器 能 按 预期 工作 : 
SS eo ee ee a eevee (Ce) 


SS Ee Se mole 
lL) 








WE YR 
'Hello’ 
‘'Hello’ 


看 起 来 很 不 错 ! 单行 后 成 器 表达 式 似乎 获得 了 和 bounadedq_repbpeateLr 生成 器 函数 相 同 的 结果 o 


但 有 一 点 需要 注意 , 生成 器 表达 式 一 经 使 用 就 不 能 重新 启动 或 重用 , 所 以 在 某 些 情况 下 生成 
器 函数 或 基于 类 的 迭代 顺 更 加 合适 。 








6.6.1 生成 器 表达 式 与 列表 解析 式 
从 前 面 可 以 看 到 ， 生 成 器 表达 式 与 列表 解析 式 有 些 类 似 : 
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Se een I (| 
SS Ol nn SY (Me oa a sm ech 


但 与 列表 解析 式 不 同 , 生成 器 表达 式 不 会 构造 列表 对 象 ,而 是 像 基 于 类 的 迭代 器 或 生成 顺 函 
数 那样 “即时 ”生成 值 。 
将 生成 需 表 达 式 分 配给 变量 能 够 得 到 一 个 可 用 的 “生成 器 对 象 ”: 


Seon 
LHeELLTO, Helo HSLtLOYN 





>>> genexpr 
<generator object <genexpr> at 0x1036c3200> 


与 其 他 迭代 器 一 样 ， 需 要 调用 next () 获取 由 生成 器 表达 式 生成 的 值 : 


>>> next (genexpr) 
'Hello" 

>>> next (genexpr) 
EL 

>>> next (genexpr) 
"Hello" 

>>> next (genexpr) 
SEOOlTEenaeio 


也 可 以 对 生成 器 表达 式 调用 1ist () 函数 来 构造 一 个 包含 所 有 生成 值 的 列表 对 象 : 
Senexor (El oe mano 


>>> list (genexpr) 
FE He HelEtos Hieiiow 


当然 ,这 里 只 是 为 了 展示 如 何 将 生成 器 表达 式 〈 或 其 他 任何 迭代 器 ) 转换 为 列表 。 如 果真 的 
需要 一 个 列表 对 象 ， 那 么 通常 从 一 开始 就 会 直接 编写 一 个 列表 解析 式 。 


下 面 来 仔细 看 看 这 个 简单 的 生成 器 表达 式 的 语法 结构 ， 初 始 的 基本 模式 看 起 来 如 下 所 示 : 
genexpr = (expression for item in Collection) 


上 面 的 生成 融 表 达 式 “模板 ”对 应 于 下 面 这 个 生成 器 函数 : 


def generator () : 
TOO 
yield expression 


和 列表 解析 式 一 样 ， 这 种 固定 模式 可 用 来 将 许多 生成 器 函数 转换 为 简洁 的 生成 器 表达 式 。 
6.6.2 ”过 滤 值 
还 可 以 为 上 面 的 模板 添加 条 件 来 过 滤 元 素 ， 来 看 一 个 例子 : 















































SS cvendDoouaeec (0 ol ean 0 
TE S02 (0) 
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这 个 生成 器 产生 从 0 到 9 所 有 偶数 的 平方 数 。 过 滤 条 件 使 用 * ( 取 模 ) 运算 符 来 排除 所 有 不 
能 被 2 整除 的 值 : 


>>> for x in even_sdquares : 
ne 


QE 36 644 


现在 更 新 生成 器 表达 式 模 板 ， 在 添加 if 条 件 过 滤 元 素 后 ， 模 板 如 下 所 示 : 


ene enet ee 
TE conan Len) 


同样 ,这 种 模式 对 应 下 面 这 种 直观 但 代码 量 更 多 的 生成 器 函数 ,此 时 语法 糖 的 优点 就 展现 了 
出 来 : 


def generator(): 
tee eem Ma eol eae 
TE ero ie Ions 
yield expression 








6.6.3 内 联 生成 器 表达 式 
因为 生成 器 表达 式 也 是 表达 式 ， 所 以 可 以 与 其 他 语句 一 起 内 联 使 用 。 例 如 ， 可 以 定义 一 个 挝 
代 器 并 立即 在 for 循环 中 使 用 : 


人 
oe (G3) 


另外 还 有 一 个 语法 技巧 可 以 美化 生成 器 表达 式 。 如 果 生 成 器 表达 式 是 作为 函数 中 的 单个 参数 
使 用 ， 那 么 可 以 删除 生成 器 表达 式 外 层 的 括号 : 


Sune ee 
90 








# 与 


> n(n 
90 


这 样 可 以 编写 简洁 且 高 性 能 的 代码 。 因 为 表达 式 会 像 基 于 类 的 迭代 器 或 生成 器 函数 那样 “ 即 
时 ”生成 值 ， 所 以 内 存 占用 很 低 。 





























6.6.4 物 极 必 反 


像 列 表 解 析 式 一 样 ， 生 成 器 表达 式 还 可 以 处 理 更 复杂 的 情况 。 比 如 藤 套 多 个 for 循环 和 添 
加 链 式 过 滤 语 句 ， 让 生成 需 表 达 式 能 处 理 许多 情形 : 
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[全 
ED 


i wl cc le tokohalohN)y) 
上 面 这 个 模式 可 转换 为 下 面 这 个 生成 句 函 数 逻 辑 : 


上 
了 
Oe 
Me nel: 


oO 
ENG 
se Mebane 























这 就 是 我 想 要 提出 的 一 个 重要 警告 : 不 要 编写 这 样 深度 藤 套 的 生成 右 表 达 式 。 从 长 远 来 看 ， 
过 度 座 套 的 生成 器 表达 式 很 难 维护 。 


这 是 一 个 物 极 必 反 的 情形 ， 过 度 使 用 一 个 美丽 而 简单 的 工具 会 产生 难以 阅读 和 调试 的 程序 。 
与 列表 解析 式 一 样 ， 我 个 人 会 避免 编写 符 套 两 层 以 上 的 生成 名 表达 式 。 


生成 器 表达 式 是 有 用 且 具 有 Python 特色 的 工具 ， 但 不 能 当 作 万 金 油 来 用 。 对 于 复杂 的 迭代 
器 ， 最 好 编写 生成 顺 函 数 或 者 基于 类 的 迭代 器 。 

如 果 需 要 使 用 赔 套 的 生成 融和 复杂 的 过 滤 条 件 , 通常 最 好 将 子 生成 器 提取 出 来 (这样 就 可 以 
命名 ) 然后 再 互相 链接 。 下 一 节 会 介绍 这 一 点 。 


如 果 还 是 不 确定 应 该 用 哪 种 方法 , 那么 就 先 编写 儿 个 不 同 的 实现 , 然后 从 中 选择 可 读 性 最 好 
的 实现 。 相 信 我 ， 从 长 远 来 看 这 样 能 节省 时 间 。 













































































6.6.5 ”关键 要 点 


口 生成 器 表达 式 与 列表 解析 式 类 似 ， 但 不 构造 列表 对 象 ， 而 是 像 基于 类 的 迭代 吉 或 生成 器 
函数 那样 “即时 ”生成 值 。 

口 生成 器 表达 式 一 经 使 用 就 不 能 重新 启动 或 重新 使 用 。 

口 生成 器 表达 式 最 适合 实现 简单 的 “实时 ”和 迭代 器 ， 而 对 于 复杂 的 和 欠 代 器 ， 最 好 编写 生成 
器 函数 或 基于 类 的 迭代 器 。 
































6.7 友 代 器 链 


Python 中 的 迭代 器 还 有 另 一 个 重要 特性 : 可 以 链接 多 个 迭代 器 ， 从 而 编写 高 效 的 数据 处 理 
“管道 ”。 第 一 次 见 到 这 种 模式 是 在 David Beazley 的 PyCon 演讲 上 ， 这 给 我 留 下 了 深刻 的 印象 。 





























利用 Python 的 生成 器 函数 和 生成 器 表达 式 能 很 快 构建 简洁 而 强大 的 迭代 器 链 。 本 节 将 介绍 
迭代 器 链 的 实际 用 法 ， 以 及 如 何 将 其 应 用 到 自己 的 程序 中 。 

快速 回顾 一 下 ， 生 成 器 和 生成 器 表达 式 是 Python 中 编写 迭代 需 的 语法 糖 。 与 编写 基于 类 的 
迭代 器 相 比 ， 这 种 方式 能 够 省 去 许多 样板 代码 。 

普通 函数 只 会 产生 一 次 返回 值 , 而 生成 器 会 多 次 产生 结果 。 可 以 认为 生成 器 在 整个 生命 周期 
中 能 产生 值 的 “ 流 ”。 

例如 ， 下 面 的 生成 器 中 是 一 个 计数 器 ， 每 次 调用 next () 时 会 产生 一 个 新 值 ， 从 而 生成 从 1 
到 8 的 整数 值 : 

def integers(): 


(全 有 
St el 






































你 可 以 在 Python REPL 中 运行 来 确认 这 个 行为 : 
SS needs 


> (nanny 
2 dg 7 en 


到 目前 为 止 并 不 太 有 趣 ， 但 下 面 来 看 一 点 厉害 的 。 生 成 器 可 以 相互 “连接 ”， 来 构建 像 管 道 
那样 工作 的 高 效 数据 处 理 算法 。 

你 可 以 从 integers () 生 成 器 中 获取 值 的 “ 流 ”， 将 其 再 次 送 入 另 一 个 生成 器 。 例 如 ， 计 算 
传人 的 每 个 数 的 平方 ， 之 后 再 次 传 出 : 


def sdquaredq(sed) : 
Eor in seo 
sx evo ak 




















这 就 是 “数据 管道 ”或 “生成 器 链 ” 的 功能 : 
>>> chain = squared (integers()) 


> te eon 
[S564 


这 个 管道 能 继续 添加 新 的 组 件 。 数据 仅 单 向 流动 , 并 且 每 个 处 理 步骤 都 通过 严格 定义 的 接口 
与 其 他 处 理 步骤 隔离 。 

这 与 Unix 中 的 管道 工作 方式 类 似 。 我 们 也 是 将 一 系列 过 程 链 接 在 一 起 ， 每 个 过 程 的 输出 直 
接 作为 下 一 个 过 程 的 输入 。 

现在 在 管道 上 增加 一 个 步 又， 对 每 个 值 取 负 数 然后 传递 给 链 中 的 下 一 个 处 理 步骤: 

















def negatedq(sed) : 
Om ee 
ie 
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7 得 


如 果 重 新 构建 生成 器 链 并 在 最 后 加 上 negated 生成 器 的 话 ， 就 会 得 到 下 面 的 结 刁 
>>> chain = negated(squared (integers())) 


SS ve (rain 
[| 


对 于 生成 器 链 ， 我 最 喜欢 的 一 点 是 其 中 每 次 只 处 理 一 个 元 素 。 链 中 的 处 理 步 又 之 间 没 有 组 


冲 区 。 


(1) integers 生成 器 产生 一 个 值 ， 如 3。 

(2) 这 个 值 “激活 ”squared 生成 器 来 处 理 ， 得 到 3 x 3 = 9， 并 将 其 传递 到 下 一 阶段 。 
(3) 由 squared 生成 器 产生 的 平方 数 立即 送 入 negated 生成 器 ,将 其 修改 为 -9 并 再 次 yield。 
你 可 以 继续 扩展 这 个 生成 器 链 , 添加 自己 的 步骤 来 构建 处 理 管 道 。 生 成 器 链 可 以 高 效 执行 并 











且 很 容易 修改 ， 因 为 链 中 的 每 一 步 都 是 一 个 单独 的 生成 器 函数 。 














这 个 处 理 管道 中 的 每 个 生成 器 函数 都 非常 简洁 。 下面 通过 一 个 小 技巧 来 再 次 f 

















定义 ， 同 时 不 会 牺牲 可 读 性 : 


integers = range(8) 
squared (hey 
negated Cior mauarea 


注意 , 这 里 将 每 个 处 理 步骤 将 换 成 一 个 在 前 一 步 基础 上 处 理 的 生成 器 表达 式 , 等 价 于 前 面 介 





绍 的 生成 需 链 。 


>>> negated 

<generator object <genexpr> at 0x1098bcb48> 
>>> list (negated) 

[0 =, = 9 S10 25; -3 Sd 














使 用 生成 器 表达 式 的 唯一 缺点 是 不 能 再 使 用 函数 参数 进行 配置 , 也 不 能 在 同一 处 理 管道 中 多 





次 重复 使 用 相同 的 生成 器 表达 式 。 


党 





不 过 , 你 能 够 在 构建 这 些 管 道 时 自由 组 合 和 匹配 生成 器 表达 式 和 普通 生成 器 ， 有 助 于 提高 复 





管道 的 可 读 性 。 


关键 要 点 


口 生成 器 可 以 链接 在 一 起 形成 高 效 且 可 维护 的 数据 处 理 管道 。 
口 互相 链接 的 生成 器 会 逐个 处 理 在 链 中 通过 的 每 个 元 素 。 
口 生成 器 表达 式 可 以 用 来 编写 简洁 的 管道 定义 ， 但 可 能 会 降低 代码 的 可 读 性 
































O 


第 7 章 
字典 技巧 








7.1 字典 默认 值 


Python 的 字典 有 一 个 get () 方 法 ,在 查找 键 的 时 候 会 提供 备 选 值 ,这 个 方法 适用 于 许多 情况 。 
下 面 通过 一 个 简单 的 例子 演示 一 下 。 假 设 有 以 下 数据 结构 将 用 户 ID 映射 到 用 户 名 : 








mamcaror ne 三 
[3182 Ae 
SSO el 


SOON De 
} 
现在 想 用 这 个 数据 结构 编写 一 个 greeting () 函数 ， 根 据 用 户 ID 向 用 户 返 回 问候 语 。 第 一 
个 实现 看 起 来 可 能 像 这 样 : 


def greeting (userid): 
ee bm I ee ee ne eel ver 





这 进行 了 直观 的 字典 查找 。 不 过 这 个 实现 只 有 在 用 户 ID 位 于 name_for_userid 字典 中 时 
才能 正常 工作 。 如 果 向 oreet ing 函数 传递 无 效 的 用 户 ID 则 会 抽出 异常 ， 





>>> greeting (382) 
ET A 


7 
>>> greeting(33333333) | 


EDO 3 




















我 们 并 不 希望 看 到 KeyError 异常 ， 因 此 最 好 在 找 不 到 用 户 人 DD 时， 让 函数 返回 一 个 通用 的 
问候 语 作为 备 选 。 

















下 面 来 实现 这 个 想法 。 首 先 想到 的 可 能 是 在 字典 中 查找 键 ， 如 果 找 不 到 这 个 用 户 ID 就 返回 
默认 问候 语 : 
def greeting (userid): 


J OS en nente ee on eol 
Return me emerorausemra sere 





else: 
ee ene 


对 这 个 greeting () 实现 使 用 之 前 的 测试 用 例 : 


>>> greeting(382) 
AN SN 








le (0) 
WT Oe, 


好 多 了 , 未知 用 户 现 在 会 得 到 通用 的 问候 语 , 而 在 找到 有 效用 户 ID 时 会 得 到 个 性 化 的 问候 语 。 


虽然 这 个 新 实现 能 得 到 预期 的 结果 ,并且 看 起 来 短小 简洁 ,但 仍然 可 以 改进 。 目 前 的 方法 有 
如 下 几 个 缺点 。 


口 效率 低下 ， 需 要 查询 字典 两 次 。 

口 元 长 ， 问 候 字符 串 有 些 重复 。 

D 不 够 有 Python 特色 ， 官 方 Python 文档 特别 建议 使 用 “请 求 原谅 比 获 得 许可 要 容易 ” 
( easier to ask for forgiveness than permission，EAFP ) 的 编码 风格 : 






































“这 种 通用 的 Python 编码 风格 会 先 假 定 存 在 有 效 的 键 或 属性 ， 如 果 假 设 错误 再 捕获 


吕 夫 ， 0 
开 币 。 


基于 EAFP 原则 还 有 一 种 更 好 的 实现 , 即 不 显 式 检查 键 是 否 包含 在 内 , 而 是 使 用 try. . .except 
块 捕获 KeyError: 

def greeting (userid): 
es 

an ee ee ey 


except KeyError: 
TE lol a a elee 


这 种 实现 也 满足 最 初 的 要 求 ， 而 且 无 须 查 询 字 典 两 次 。 

然而 还 能 将 其 进一步 改进 成 更 简洁 的 方案 。Python 的 字典 上 有 gef () 方 法 ， 其 中 可 以 传递 一 
个 用 作 备 选 值 的 “默认 ”人 参数: “ 

def greeting (userid): 


Ieee a 
name_for userid.get( userid, 'there') 


当 调 用 get () 时 ， 雍 会 检查 字典 中 是 否 存在 给 定 的 键 。 如 果 存 在 , 则 返回 该 键 对 应 的 值 。 如 
果 不 存在 ， 则 返回 默认 的 备 选 值 。 从 上 面 可 以 看 到 ， 这 个 greeting 的 实现 仍然 按照 预期 工作 
















































































人 @ 详 见 Python 术语 表 :“EAFP”。 
@) 详 见 Python 文 档 :“dict.get() method”。 
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>>> greeting(950) 
过 


> ogreeerne(de 8s 
'Hi there!’ 




















最 终 版 的 greeting () 实现 干净 简洁 ， 只 用 到 了 Python 标准 库 中 的 特性 。 因 此 我 认为 这 是 
针对 这 种 特殊 情况 的 最 佳 解决 方案 。 


关键 要 点 


口 测试 包含 关系 时 应 避免 显 式 检查 字典 的 键 。 
口 建议 使 用 EAFP 风格 的 异常 处 理 或 使 用 内 置 的 get () 方 法 。 
口 在 某 些 情况 下 ， 可 以 使 用 标准 库 中 的 collections.defaultdict 类 。 








7.2 字典 排序 
Python 字典 是 无 序 的 ， 因 此 迭 代 时 无 法 确保 能 以 相同 的 顺序 得 到 字典 元 素 ( 从 Python 3.6 开 
始 ， 字 上 典 会 保有 顺序 ?)。 


但 有 时 需要 根据 某 项 属性 ， 如 字典 的 键 、 值 或 其 他 派生 属性 对 字典 中 的 项 排序 。 假 设 有 一 个 
带 有 以 下 键 值 对 的 字典 xs: 

> el 

为 了 获得 以 字典 中 键 值 对 组 成 的 有 序列 表 ， 可 以 先 使 用 字典 的 items () 方 法 获得 列表 ， 接 
着 对 其 排序 : 


Ssoreeg(Gs Teems 人 
(So (0 lo (PC ee (0 lols) | 


这 个 键 值 对 的 元 组 根据 Python 中 的 标准 词典 顺序 排列 。 


比较 两 个 元 组 时 ，Python 首先 比较 存储 在 索引 0 位 置 的 项 。 如 果 不 相 同 ， 则 返回 比较 绪 
如 果 相 同 ， 则 继续 比较 索引 1 处 的 两 个 项 ， 以 此 类 推 。 


为 这 个 元 组 来 自 于 字典 , 所 以 每 个 元 组 中 索引 0 的 字典 键 都 是 唯一 的 ,排序 不 会 破坏 字典 
中 已 有 的 关系 。 


我 们 有 时 候 需 要 按 字典 的 键 来 排序 ， 但 有 些 时 候 则 希望 按 值 对 字典 排序 。 













































































@D 这 里 的 有 序 是 插入 顺序 ， 并 不 是 键 或 值 的 比较 顺序 。 在 Python 3.7 中 ， 已 经 将 有 序 作 为 语言 特性 确定 下 来 了 。 
一 一 译 者 注 
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幸运 的 是 ， 有 一 种 方法 可 以 控制 字典 项 的 排序 方式 。 向 sorted() 函数 传递 一 个 key 函数 能 
够 改变 字典 项 的 比较 方式 。 


key 函数 是 一 个 普通 的 Python 函数 ,在 比较 之 前 会 在 每 个 元 素 上 调用 。key 函数 将 一 个 字典 
项 作为 其 输入 ， 然 后 为 排序 返回 比较 所 需 的 key。 


这 里 在 不 同 语 境 中 使 用 了 “key” 这 个 词 ，key 函数 和 字典 的 键 (key ) 无 关 ， 前 者 只 是 将 每 
个 给 入 项 映射 成 一 个 用 于 比较 的 key。 
来 看 一 个 例子 ， 通 过 真实 的 代码 来 帮助 理解 key 函数 。 


如 果 想 根据 字典 项 的 值 来 排序 字典 ,可 以 使 用 下 面 的 key 函数 ,这 个 函数 会 返回 键 值 对 元 组 
中 的 第 二 个 元 素 : 


Some eens kev am ea 
CBE. DY (er Qe (DPD 2 (aD 






































现在 得 到 了 基于 原 字 典 中 的 值 排序 得 到 的 键 值 对 列表 。key 函数 的 概念 很 强大 ， 能 应 用 于 许 
多 Python 情形 ， 因 此 值得 花 一 些 时 间 来 掌握 其 工作 方式 。 

事实 上 ， 由 于 这 个 概念 及 其 常见 ， 因 此 Python 的 标准 库 包 含 了 operator 模块 。operator 
模块 将 一 些 常用 的 key 函数 实现 为 即 插 即 用 的 组 件 ， 如 operator .itemgetter 和 operator. 
attrgettero 








下 面 这 个 示例 用 operator.itemgetter 替换 了 第 一 个 示例 中 基于 lambda 的 索引 查找 : 





>>> import operator 

>>> sorted(xs.items(), key=operator.itemgetter(1)) 

[0 (Cl) (A 2) (l(c 

有 时 使 用 operator 模块 能 更 清楚 地 传达 代码 的 意图 ， 但 有 时 使 用 简单 的 lambda 表达 式 
编写 的 代码 就 已 经 有 足够 的 可 读 性 且 含 义 更 加 明确 。 在 这 个 特定 的 例子 中 ， 我 更 喜欢 lambda 表 
达 式 。 

使 用 lambda 作为 自 定义 key 函数 的 男 一 个 好 处 是 可 以 更 细致 地 控制 排列 顺序 。 例 如 ， 还 可 
以 根据 存储 的 每 个 值 的 绝对 值 对 字典 排序 : 


>>> sorted(xs.items(), key=lambda x: abs (x[1])) 


如 果 需 要 逆序 排列 以 便 把 最 大 值 放 在 前 面 , 则 可 以 在 调用 sorted () 时 使 用 reverse=True 
关键 字 参 数 : 


SS> Sorted(xs TEemes() 
evetltdmbaa Eyes 
reverse=True) 
(0 (| 
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就 像 刚刚 说 的 那样 ， 值 得 花费 一 些 时 间 来 掌握 Python 中 key 函数 的 工作 方式 。key 函数 提供 
了 很 大 的 灵活 性 ， 通 常 可 以 省 去 编写 用 于 在 不 同 数据 结构 之 间 转 换 的 代码 。 


























关键 要 点 


口 在 创建 字典 和 其 他 集合 的 有 序 “ 视 图 ”时 ， 可 以 通过 key 函数 决定 排序 方式 。 

口 key 函数 是 Python 中 的 一 个 重要 概念 ， 标 准 库 中 的 operator 模块 添加 了 许多 经 常 使 用 
的 key 函数 。 

口 也 数 是 Python 中 的 一 等 公民 ， 是 在 Python 中 无 处 不 在 的 强大 特性 。 


























7.3 ”用 字典 模拟 switch/case 语句 


Python 没有 switch/case 语句 ， 因 此 有 时 候 需 要 用 很 长 的 if...elif...else 链 作为 替 
代 品 。 本 节 将 介绍 一 个 在 Python 中 使 用 字典 和 头等 函数 来 模拟 switch/case 语句 的 技巧 。 听 起 
来 很 激动 人 心 ， 下 面 开 始 吧 ! 


假设 程序 中 有 以 下 if 链 : 


nd on 
hnandle al() 
RE 
局 hnandle, b'() 
. else: 
nandle default!() 


当然 ， 这 里 只 有 三 种 情况 ， 还 不 算 太 糟 。 但 如 果 有 十 几 个 elif 分 支 ， 那 么 就 有 点 麻烦 了 。 
我 认为 非常 长 的 if 语句 链 是 一 种 糟糕 的 编码 方式 ， 让 程序 难以 阅读 和 维护 。 


用 字典 查找 表 可 以 模拟 switch/case 语句 的 行为 ， 从 而 蔡 换 这 种 很 长 的 if.. .elif...else 
语句 。 


思路 是 利用 Python 中 头等 函数 的 特性 ， 即 函数 可 以 作为 参数 传递 给 其 他 函数 ， 也 可 作为 其 
他 函数 的 值 返回 ， 还 可 以 分 配给 变量 并 存储 在 数据 结构 中 。 


例如 ， 我 们 可 以 定义 一 个 函数 并 存储 在 列表 中 以 备 后 用 : 


SS dof mytimne la 
return a + Pb 




































































Se [ere] 
>>> ee 
Eula Mea mv ee cade (O10 /IO 2 0 


调用 该 函数 的 语法 很 直观 , 只 需要 在 列表 中 使 用 索引 访问 , 然后 用 () 调用 语法 来 调用 函数 并 








SS neo (2 3) 


那么 如 何 使 用 头等 函数 的 特性 简化 链 式 if 语句 呢 ? 核心 思想 是 定义 一 个 字典 ， 在 字典 的 键 
值 对 中 ， 键 是 输入 条 件 ， 值 是 用 来 执行 对 应 操作 的 函数 : 
> nce 


neoneee .anceEan 
eoneml .han 




















es 
这 样 就 不 必 通 过 if 语句 进行 筛选 ， 而 是 在 检查 每 个 条 件 时 ， 查 找 对 应 的 字典 键 来 获取 并 调 
用 相应 的 处 理 函 数 : 


Scena concen 
Ene eonalne 





























这 个 实现 差不多 可 以 工作 了 , 只 要 cond 位 于 字典 中 即 可 。 如 果 不 存在 , 则 会 得 到 KeyError 
异常 。 

因此 还 需要 用 一 种 方法 来 文 持 默认 情况 以 便 对 应 if 语句 中 的 else 分 文 。 幸 和 运 的 是 Python 
字典 有 一 个 get () 方 法 , 用 来 返回 给 定 键 的 值 ; 如 果 找 不 到 , 则 返回 一 个 默认 值 。 这 正好 能 用 于 
此 处 : 


TO 


这 段 代码 可 能 乍 一 看 语法 很 奇怪 , 但 在 深入 剖析 后 ,你 会 发 现 其 工作 方式 与 前 面 的 例子 完全 
相同 。 这 里 又 用 到 了 Python 的 头等 函数 特性 , 将 handle_default 传递 给 get ( ) 作为 查找 的 备 
选 值 。 此 时 如 果 在 字典 中 找 不 到 某 个 条 件 就 会 调用 默认 处 理 函 数 ， 不 会 再 抛 出 KeyError。 

下 面 来 看 一 个 更 完整 的 例子 ， 其 中 使 用 了 字典 查找 和 头等 函数 替换 if 语句 链 。 你 阅读 完 下 
面 这 个 示例 就 能 明白 这 种 固定 模式 ， 它 用 来 将 某 些 类 型 的 if 语句 转换 为 基于 字典 的 分 支 决策 。 


首先 用 if 链 来 编写 一 个 函数 , 之 后 再 转 成 字典 形式 。 该 函数 接受 像 aaa 或 mul 这 样 的 字符 


















































串 操 作 码 ， 然 后 对 操作 数 x 和 y 进行 一 些 运算 : 
> er non (to 
ec = ls: 
return X + Y 
ROSE 全 
return x-y 

els oPesator mae: 
PAE 央 六 < 守 全 

IE enat or = ve: 
I ln 
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说 实话 ， 虽 然 这 只 是 另 一 个 简单 的 示例 〈 完 整 的 例子 需要 粘贴 大 段 无 聊 的 代码 )， 但 能 很 好 
地 说 明 底层 的 设计 模式 。 一 旦 理解 这 种 模式 ， 就 能 将 其 应 用 于 各 种 不 同 的 场景 。 








你 可 以 尝试 调用 dispatch_if () 函数 ,向 其 传递 字符 串 操 作 码 和 两 个 数 来 执行 简单 的 计算 : 


S02 ol ee en es Wn el) 

16 

> te en Vi) 
None 





注意 ，unknown 的 情形 能 够 正常 工作 是 因为 Python 会 向 所 有 图 数 结尾 添加 隐 式 的 return 
None 语句 o 


到 现在 为 止 还 不 错 ， 现 在 将 原始 aispatch_if () 转换 成 一 个 新 函数 ， 其 中 使 用 字典 将 操作 
码 映 射 到 用 于 对 应 的 头等 函数 中 ， 以 便 执 行 相 应 的 算术 运算 。 


SE oe ol oie nie leo eee ee A) 
I ha EL 





ram amide x 
"oD ,lambda Ke VY 
1 he 
li anlar 
}.get (operator, lambda: None) () 








这 种 基于 字典 的 实现 结果 与 原始 dispatch_if () 相 同 。 两 个 函数 的 调用 方式 完全 相同 : 


SCY /ood en le no 

16 

SE Ce oe 2 
None 


这 段 代 码 还 可 在 几 个 方面 继续 改进 从 而 达到 实用 水 准 。 


首先 ， 每 次 调用 aispatch_aict () 时 都 会 为 操作 码 查 找 创建 一 个 临时 字典 和 一 串 lambda 
表达 式 ， 从 性 能 角度 来 看 这 并 不 理想 。 对 于 注重 性 能 的 代码 ， 可 以 先 创建 字典 并 将 其 作为 常量 ， 
之 后 调用 该 函数 时 可 以 再 次 引用 这 个 字典 ， 不 用 每 次 查找 时 都 重新 创建 。 


其 次 ， 如 果真 的 想 做 一 些 像 x + y 这 样 简单 的 算术 , 那么 最 好 使 用 Python 的 内 置 operator 
模块 ， 而 不 是 使 用 示例 中 的 lambda 函数 。operatot 模块 实现 了 所 有 的 Python 操作 符 ， 例 如 
operator.mul 和 operator.div 等 。 不 过 这 不 是 什么 大 问题 。 前面 只 是 故意 使 用 lambda 来 让 
例子 更 具 普 适 性 ， 有 助 于 你 将 这 种 模式 应 用 到 其 他 情况 。 






































现在 你 又 学 会 了 一 种 技巧 ， 可 以 用 来 简化 某 些 元 长 的 if 语句 链 。 但 要 记 住 ， 这 种 技术 不 是 
万 金 油 ， 有 时 用 简单 的 if 语句 会 更 好 。 
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关键 要 点 

















7.4 “最 疯狂 ”的 字典 表达 式 
有 时 候 你 会 突然 碰 到 一 段 很 有 深度 的 代码 ， 仔 细 琢 磨 就 能 从 中 学 到 很 多 关于 这 门 语言 的 知 


识 。 这 样 的 代码 片段 就 像 一 个 禅宗 的 “公案 ”修行 一 一 从 问题 或 故事 中 引出 疑问 再 











口 Python 没有 switch/case 语句 ， 但 在 某 些 情况 下 可 以 使 用 基于 字典 的 调度 表 来 避免 长 
if 语句 链 。 
口 这 个 技巧 再 次 证 明了 Python 的 头等 函数 是 强大 的 工具 ， 但 能 力 越 大 ， 责 任 越 大 。 

















接 引 禅 徒 。 








本 节 将 要 讨论 的 一 小 段 代 码 就 是 这 样 的 一 个 例子 。 这 段 代 码 乍 看 起 来 可 能 像 一 个 普通 的 字典 
表达 式 ， 但 深入 体会 就 会 让 你 对 CPython 解释 器 来 一 次 扩展 心智 的 旅程 。 

我 很 看 重 这 行 代码 ， 有 一 次 把 它 印 了 在 我 的 Python 会 议 徽章 上 。 以 这 行 代码 充当 话 头 ， 我 
和 其 他 Python 参 会 人 员 进行 了 一 些 受 益 菲 浅 的 对 话 。 

言 归 正 传 ， 来 看 代码 。 花 点 时 间 思 考 下 面 的 字典 表达 式 以 及 其 效果 : 


Se 

















GD a et A 


我 留 点 时 间 给 大 家 …… 


准备 好 了 吗 ? 








下 面 是 这 个 字 


典 表达 式 在 CPython 解释 需 会 话 中 得 到 的 结果 : 


(SO 0 1) 
{True: 'maybe'} 





我 承认 , 第 一 次 看 到 这 个 结果 时 我 也 很 惊讶 。 但 逐步 深究 就 会 发 现 这 一 切 都 是 有 道理 的 ， 所 


以 来 思考 一 下 为 什么 会 得 到 这 个 出 人 意料 的 结果 。 





当 Python 处 理 这 个 字典 表达 式 时 ， 首 先 会 构造 一 个 新 的 空 字典 对 象 ， 然 后 按照 字典 表达 式 
中 给 出 的 顺序 添加 键 和 值 。 





因此 ， 前 面 的 字典 表达 式 可 分 解 成 下 面 这 些 依次 执行 的 语句 : 


人 























>>> XS [True] YeS 

ne 

SIN 

说 来 也 怪 ，Python 认为 本 例 中 使 用 的 所 有 字典 键 都 是 相等 的 : 
NE 


True 
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好 吧 ， 但 等 一 下 。1.0 == 1 可 以 接受 , 但 为 什么 True 也 会 等 于 1 呢 ? 第 一 次 看 到 这 个 字 
典 表达 式 时 ， 我 也 被 难 住 了 。 


在 查阅 了 Python 文档 之 后 ， 我 发 现 Python 将 bool 视 为 int 的 子 类 。Python 2 和 Python 3 
都 是 如 此 : 


“布尔 类 型 是 整数 类 型 的 子 类 型 ， 布 尔 值 在 几乎 所 有 环境 中 的 行为 都 类 似 于 值 0 和 
1， 但 在 转换 为 字符 串 时 ， 分 别 得 到 的 是 字符 串 False 或 Trueo。”” 


这 意味 着 从 技术 上 来 说 ， 布 尔 值 可 以 作为 Python 中 列表 或 元 组 的 索引 : 



































SS S| 

‘yes’ 

但 是 为 了 清楚 地 表达 代码 的 含义 ， 也 为 了 不 要 让 同事 抓 狂 ， 请 不 要 以 这 样 的 方式 使 用 布尔 
变量 。 


不 管 怎样 ， 现 在 回 到 那个 字典 表达 式 。 

就 Python 而 言 ，True、1 和 1.0 都 表示 相同 的 字典 键 。 当 解释 册 处 理 字 典 表达 式 时 ， 
断 用 后 续 键 的 值 覆 盖 True 键 的 值 。 因 此 最 终 产 生 的 字典 只 包含 一 个 键 。 

在 继续 之 前 ， 再 看 看 原 字 典 表达 式 : 


SOP heb ele .le (0 ee 
{True: 'maybe'} 


为 什么 得 到 的 键 依然 是 True? 由 于 重复 赋值 ， 最 后 键 不 应 该 修改 为 1.0 吗 ? 


在 研究 了 一 番 CPython 解释 器 源码 之 后 ， 我 发 现 Python 的 字典 在 将 新 值 与 键 关联 时 不 会 自 
动 更 新 键 对 象 : 


办 


不 



































SL nie 

SS erael Ss vem 

SE 

0: SS 

当然 ， 从 性 能 优化 的 角度 上 说 得 通 。 如 果 键 相同 ， 那 为 什么 要 花 时 间 更 新 原来 的 键 呢 ? 

由 于 上 个 例子 中 永远 不 会 替换 第 一 个 作为 键 的 True 对 象 , 因此 字典 的 字符 串 表 示 仍 然 将 该 




















键 输出 为 True ( 而 不 是 1 或 1.0)。 


就 目前 掌握 的 信息 来 看 ,最 后 字典 中 的 值 被 覆盖 只 是 因为 各 自 的 键 痢 相等 。 但 
不 单单 是 因为 键 的 ”eq 相等 。 














hl 





有 实 上 ,这 也 











Oz 详 见 Python 文档 :“The Standard Type Hierarchy”。 
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Python 字 熏 本 质 上 是 散 列表 数据 结构 。 在 第 一 次 看 到 这 个 令 人 惊讶 的 字典 表达 式 时 ， 直 觉 告 


诉 我 这 种 行为 与 散 列 冲突 有 关 。 











散 列表 在 内 部 根据 每 个 键 的 散 列 值 将 键 存储 在 不 同 “ 桶 ”中 。 散 列 值 是 根据 键 生成 的 固定 长 


度 的 数值 ， 用 来 标识 这 个 键 。 








使 用 散 列 值 能 做 到 快速 查找 。 查 找 键 对 象 需 要 将 对 象 整体 与 其 他 键 对 象 逐 一 比较 ,而 在 查找 





表 中 查找 键 对 应 的 数值 散 列 值 就 要 快 得 多 。 





然而 计算 散 列 值 的 方法 一 般 做 不 到 十 全 十 美 。 实 际 上 ， 不同 的 键 可 能 会 得 到 相同 的 散 列 值 ， 





因此 这 些 刍 最终 会 落 到 查找 表 中 相同 的 桶 里 。 





如 果 两 个 键 具有 相同 的 散 列 值 , 称 之 为 散 列 冲突 。 散 列表 中 用 于 插入 和 查找 元 素 的 算法 需要 





处 理 这 些 特殊 情况 。 


根据 这 些 背 景 ,前 面 那个 字典 表达 式 得 到 的 惊人 结果 可 能 与 散 列 有 些 关系 , 所 以 下 面 来 验证 
一 下 键 的 散 列 值 是 否 真 的 导致 了 这 样 的 结果 。 








我 定义 了 下 面 这 个 类 作为 验证 工具 : 


class AlwaysEquals: 
def . eq (self, other): 
return True 


def _ hash _(self): 
Io tol ee aE, 





这 个 类 有 两 个 特殊 的 地 方 。 

首先 , 因为 其 中 的 _eqa。 双 下 划 线 方法 总 是 返 
互 之 间 相 等 : 

>>> AlwaysEquals() == AlwaysEquals() 

True 

>»>> AlWwaysEqualts() = #2 

True 

>>> AlwaysEquals() == 'waaat?' 

True 





其 次 ， 每 个 AlwaysEquals 实例 还 将 返回 

SS oe = (Danone ne 
AlwaysEquals () ， 
AlwaysEquals()] 


2329 [en vie oor a ole ee 
[2 


在 CPython 中 ，ia() 返 回 内 存 中 对 象 的 地 址 ， 




















回 THU 所 以 这 个 类 的 所 有 实例 都 会 伸 恨 装 相 





由 











内 置 ia () 函数 生成 的 唯一 散 列 值 : 





并 且 确 定 是 唯一 的 。 
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因此 这 个 类 可 以 创建 一 些 假装 相互 相等 的 对 象 , 但 其 各 自 的 散 列 值 不 同 ,以 此 来 验证 字典 键 
是 否 只 根据 相等 性 比较 结果 进行 覆盖 了 。 

从 下 面 的 例子 可 以 看 到 ， 即 使 键 都 相等 ， 相 互 之 间 也 不 会 覆盖 : 

>>> {AlwaysEquals(): 'yes', AlwaysEquals(): 'no'} 


{ <AlwaysEdquals object at 0x1L10a3c588> ‘yes', 
EAI 






































反 过 来 还 可 以 验证 若 只 是 散 列 值 相同 是 否 会 覆盖 字典 的 键 : 
class SameHash: 


def _ hash _(self): 
en 


这 个 sameHash 类 的 实例 相互 之 间 不 相等 ， 但 散 列 值 都 为 1: 





>>> a = SameHash() 
> omerasn 
>>> a == 

False 

So 0 Dashtak, Dash(thy} 
(Se 


现在 尝试 使 用 sameHash 类 的 实例 作为 字典 键 ， 来 看 看 Python 字典 的 处 理 结 
SS 


Someansmn ntoneer e0020050 -0 
oer on on 0 oO 


从 上 可 以 看 出 ， 单 单 由 于 散 列 值 相同 引起 的 冲突 并 不 会 覆盖 字典 的 键 。 


只 有 在 两 个 对 象 相等 ， 且 散 列 值 也 相同 的 情况 下 , 字典 才 会 认为 这 两 个 键 相 同 。 来 试 着 结合 
原来 的 示例 总 结 一 下 。 


{TIEUe :Yes se. TNnO%;,. 0.: 'maybe' } 字 典 表 达 式 的 计算 结果 为 {True: 'maybe'}, 


























因为 True、1 和 1.0 的 键 都 相等 ， 并 且 都 具有 相同 的 散 列 值 : 
SP he 
True 
> eh ee ollo she(l hl ol a( 0 
pe; 


现在 这 个 字典 表达 式 的 结果 也 许 就 不 怎么 令 人 惊讶 了 : 


> Se eS ONO mney ev 
{True: 'maybe'} 





这 里 涉及 了 很 多 主题 ， 且 这 个 特殊 的 Python 技巧 起 初 可 能 有 点 令 人 难以 置信 ， 所 以 在 最 初 
我 将 其 比 作 “公案 ”。 
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如 果 你 觉得 本 节 的 内 容 很 难 理解 ， 请 尝试 在 Python 解释 器 会 话 中 逐个 运行 代码 示例 ， 从 中 
会 掌握 更 多 关于 Python 内 部 的 知识 。 


关键 要 点 


口 只 有 键 的 _ eq 比较 结果 和 散 列 值 都 相同 的 情况 下 ， 字 典 才 会 认为 这 些 是 相同 的 键 。 
口 某 些 出 乎 意料 的 字典 键 冲突 可 能 会 导致 令 人 惊讶 的 结果 。 


























7.5 合并 词典 的 几 种 方式 


你 有 没有 为 某 个 Python 程序 搭建 过 配置 系统 ? 搭建 这 种 系统 的 常见 做 法 是 采用 具有 默认 配 
置 选项 的 数据 结构 ， 然 后 从 用 户 输入 或 其 他 配置 来 源 中 有 选择 地 覆盖 默认 值 。 


我 经 常 使 用 字典 作为 底层 数据 结构 来 表示 配置 中 的 键 和 值 , 因此 需要 一 种 方法 来 将 配置 的 默 
认 值 和 用 户 履 盖 的 值 合并 到 单个 字典 中 ， 作 为 最 终 配 置 值 。 


通俗 来 说 , 有 时 需要 将 两 个 或 更 多 字典 合并 为 一 个 字典 , 让 生成 的 字典 包含 各 字典 的 键 和 值 。 
本 节 将 介绍 几 种 合并 字典 的 方法 ， 先 通过 一 个 简单 的 例子 入 手 。 假 设 有 下 面 这 两 个 字典 : 


> 













































































te oe 
(oN Sp es 寺 和 
现在 要 创建 一 个 新 的 字典 zs ， 其 中 包含 xs 和 ys 中 的 所 有 键 和 值 。 如 果 仔 细 阅 读 示 例 ， 会 
发 现 字符 串 'b ' 在 这 两 个 字典 中 都 作为 键 出 现 了 ， 因 此 还 需要 考虑 如 何 处 理 重 复 键 的 冲突 问题 。 
在 Python 中 合并 多 个 字典 的 经 典 办 法 是 使 用 内 置 字典 的 update () 方 法 : 
De 


>>> zs.update (xs) 
>>> Zs.update (ys) 


你 可 能 对 upaate () 感 到 好 奇 ， 其 基本 实现 相当 于 遍历 右 侧 字典 中 的 所 有 项 ， 并 将 每 个 键 值 
对 添加 到 左 侧 字典 中 ， 在 此 过 程 中 会 用 新 的 值 覆 盖 现 有 键 对 应 的 值 : 


ler ue aee ee nea: 
one de ser a ele ee ee IE 


Ss 



































enetehlley ln ve 
函数 会 产生 一 个 新 的 字典 zs ， 其 中 包含 了 在 xs 和 ys 中 定义 的 键 : 


> SY ee on 


从 中 可 以 看 出 , 调用 upaate () 的 顺序 决定 了 冲突 的 解决 方式 。 新 字典 以 最 后 更 新 的 字典 为 
主 ， 比 如 xs 和 ys 中 都 含有 的 键 'b' 现 在 与 ys (第 二 个 字典 ) 的 值 3 关联 起 来 。 
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这 个 update() 调 用 可 以 随意 扩展 ， 因 此 能 够 合并 任意 数量 的 字典 。 这 个 办 法 实用 量 易 读 ， 
Python 2 和 Python 3 都 可 用 。 

另 一 个 在 Python 2 和 了 Python 3 中 合并 字典 的 办 法 是 结合 内 置 的 aict () 与 ** 操 作 符 来 “ 拆 包 ” 
对 象 : 

Se 


SA 
se tl Se 计 ， 


但 与 多 次 调用 upaate () 一 样 ， 这 种 方式 只 适用 于 合并 两 个 字典 ， 无 法 一 次 合并 多 个 字典 。 

从 Python 3.5 开始 ，** 操 作 符 变 得 更 加 灵活 。 "因此 在 Python 3.5+ 中 还 有 另外 一 种 更 漂亮 的 
方法 来 合并 任意 数量 的 字典 : 

Ss 

该 表达 式 的 结果 与 依次 调用 upaate () 完全 相同 。 键 和 值 按照 从 左 到 右 的 顺序 设置 ， 所 以 解 


决 冲突 的 方式 也 相同 , 都 是 右 侧 优先 。ys 中 的 值 覆 盖 xs 中 相同 键 下 已 有 的 值 。 查 看 合并 后 的 字 
典 可 以 清楚 地 看 到 这 一 点 : 
































> ese 7 eS 


我 个 人 喜欢 这 种 简洁 但 依然 具有 可 读 性 的 新 语法 。 在 元 长 和 简洁 之 间 总 是 会 有 一 个 平衡 点 ， 
最 大 限度 地 让 代码 既 可 读 又 可 维护 。 

此 如 果 使 用 的 是 Python3, 则 建议 使 用 这 种 新 语法 。** 操 作 符 还 有 一 个 优点 是 执行 起 来 比 
依次 调用 updaate () 更 快 。 


关键 要 点 


D 在 Python 3.5 及 更 高 版 本 中 ， 使 用 ** 操 作 符 可 在 一 个 表达 式 内 合并 多 个 字典 对 象 ， 现 有 
的 键 从 左 向 右 依次 覆盖 。 
口 若 想 兼容 旧版 本 的 Python ， 则 需要 用 到 内 置 字典 的 upaate () 方 法 。 
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你 可 能 试 过 在 程序 中 插入 许多 print 语句 来 跟踪 执行 流程 ， 以 此 来 调试 bug 或 生成 日 志 信 
息 来 输出 某 些 配置 设置 。 


我 在 Python 中 以 字符 串 形 式 打印 一 些 数据 结构 时 ， 输 出 结果 会 难以 阅读 ， 因 此 我 常常 感到 











GD 详 见 PEP 448: “Additional Unpacking Generalizations”。 
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很 肖 形 。 例 如 下 面 有 个 简单 的 字典 , 在 解释 器 会 话 中 输出 时 不 仅 键 是 乱 序 排 列 ， 而 且 字 符 串 中 也 
没有 缩 进 : 











> ae 3 00kEGe 
>>> str (mapping) 
US A ee De Eh 























幸运 的 是 ， 有 一 些 方便 的 方法 能 直观 地 将 字典 转换 成 可 读 的 结果 。 一 种 是 使 用 Python 的 内 
置 json 模块 ， 即 使 用 json .qumps () 以 更 好 的 格式 输出 Python 字典 : 





SS Tao eo 
on du ea le On ee 


{ 

ei ey 

vio ay, 

evs lod 
y 








这 些 设置 会 生成 带 有 缩 进 的 字符 串 表示 形式 , 同时 对 字典 键 的 顺序 进行 规范 化 处 理 以 提高 可 
读 性 。 


虽然 结果 看 起 来 不 错 且 可 读 ， 但 还 不 是 完美 的 解决 方案 。json 模块 只 能 序列 化 含有 特定 类 
型 的 字典 。 对 于 Python 3.7?， 能 够 序列 化 的 内 置 类 型 有 : 























DQ dict 

D list、 tuple 

D str 

Dint、float (和 一 些 Enum ) 
口 bool 

口 None 














这 意味 着 如 果 字 典 含有 不 支持 的 数据 类 型 ， 如 函数 ， 那 么 在 打印 时 会 遇 到 问题 : 


| 
TyDeprror Mkeys must be a string" 





YC 








尝试 使 用 json .dumps () 来 序列 化 其 他 内 置 数 据 类 型 也 会 遇 到 这 种 问题 : 


2 nae ee 
>>> json.dumps (mapping) 
用 和 交合 en ale 


此 外 , 在 序列 化 Unicode 文本 时 可 能 会 遇 到 问题 一 一 将 从 json .qumps () 得 到 的 字符 串 复 制 
粘贴 到 Python 解释 需 会 话 中 有 时 并 不 能 重建 原 字 典 对 象 。 








GD 详 见 Python 文档 :“json module”。 
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总 之 这 种 方法 有 许多 缺点 ， 下 面 来 看 男 一 种 更 通用 的 方法 。 在 Python 中 美观 输出 对 象 的 经 
典 办 法 是 使 用 内 置 的 pprint 模块 ， 来 看 一 个 例子 : 





SN iE 
> (en ne) 
人 





可 以 看 到 ，pprint 能 够 打印 像 集合 这 样 的 数据 类 型 ， 同 时 还 能 以 固定 顺序 打印 字典 键 。 与 
字典 的 标准 字符 串 形式 相 比 ， 其 结果 更 适合 阅读 。 

不 过 与 json .dumps () 相 比 ，pprint 并 不 能 很 好 地 表示 髓 套 结构 。 有 时 这 是 优点 ， 有 时 则 
是 缺点 。 我 偶尔 会 使 用 json .daumps () 打印 字典 , 其 可 读 性 和 格式 化 都 更 好 , 但 前 提 是 字典 中 只 
含有 JSON 能 够 序列 化 的 数据 类 型 。 























关键 要 点 


口 Python 中 字典 对 象 的 默认 字符 串 转 换 结果 可 能 不 适合 阅读 。 
D pprint 和 json 模块 是 Python 标准 库 内 置 模块 ， 能 精确 、 清 晰 地 打印 字典 。 
口 注意 只 能 对 JSON 能 够 序列 化 的 键 和 值 类 型 使 用 json .dumps () ， 否 则 会 触发 TypeError。 

















Python 式 高 效 技巧 








8.1 探索 Python 的 模块 和 对 象 























在 Python 解释 器 中 可 以 直接 交互 式 地 探索 模块 和 对 象 。 这 是 一 个 被 低估 的 特性 ， 很 容易 被 
忽略 ， 特 别 是 对 于 刚刚 从 男 一 门 语言 切换 到 Python 的 人 来 说 ， 更 是 如 此 。 


对 于 许多 编程 语言 


握 


来 说 , 如 果 不 查 阅 在 线 文档 或 认真 学 习 接口 定义 , 那么 很 难 了 解 包 或 类 的 
内 部 内 容 。 











Python 就 不 一 样 ， 高 效 的 开发 人 员 会 花费 大 量 时 间 在 Python 的 REPL 会 话 中 交互 式 地 使 用 
解释 器 。 我 就 经 常 在 REPL 会 话 中 编写 小 段 代码 , 然后 将 其 复制 粘贴 到 编辑 器 正在 处 理 的 Python 
文件 中 。 


本 闻 将 介绍 两 种 用 于 在 解释 器 中 交互 式 地 探索 Python 类 和 方法 的 简单 技巧 。 








这 些 技巧 可 用 于 以 任何 方式 安装 的 Python , 只 需要 在 命令 行 中 使 用 python 命令 启动 Python 
解释 器 即 可 。 这 特别 适合 在 无 法 使 用 高 级 编辑 器 或 IDE 的 系统 上 调试 会 话 , 比 如 在 终端 会 话 中 通 
过 网 络 工作 ( ssh )。 











准备 好 了 吗 ? 让 我 们 开始 吧 ! 假设 你 正在 编写 一 个 程序 , 它 使 用 Python 标准 库 中 的 aat et ime 
模块 。 那 么 如 何 确 定 这 个 模块 能 导出 哪些 函数 或 类 ， 以 及 这 些 类 中 有 哪些 方法 和 属性 呢 ? 























数 能 








一 种 方法 是 使 用 搜索 引擎 或 在 网 上 查找 官方 的 Python 文档 ， 而 使 用 Python 内 置 的 air() 函 
[ 接 在 Python REPL 中 访问 这 些 信息 : 








>>> import datetime 
>>> dir(datetime) 
['MAXYEAR', 











MI A oat els cached. 
ee file loader name 
'_ package spec DOs vol he ro hoe 
'date', 'datetime', 'datetime_ CAPI', 'time', 
eneele es Me 


te 2 ar | 


在 上 面 的 例子 中 ， 首 先 从 标准 库 导 和 datetime 模块 ， 然 后 用 dir () 函数 查看 这 个 模块 。 
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在 模块 上 调用 air() 可 以 得 到 按 字母 顺序 排列 的 名 称 和 属性 列表 。 

由 于 Python 中 的 一 切 缘 为 对 象 ， 因 此 这 个 技巧 不 仅 适 用 于 模块 本 身 ， 还 可 用 于 模块 导出 的 
类 和 数据 结构 。 

事实 上 ， 还 可 以 对 感 兴趣 的 对 象 继续 调用 dir () 。 例 如 下 面 查看 了 aatetime.aqate 类 : 





>>> dir(datetime.date) 

on veo wn Men ol UA ne vl 
SO cleneo orn SOWweeleer io mi 
umeontehn ee Golaee ,ese ieone ou eee 
Veil Oo ee eo oe oe ye | 








从 中 可 以 看 到 ，gir () 能够 让 你 快速 浏览 模块 或 类 中 可 用 的 内 容 。 如 果 不 记 得 某 个 特定 类 或 
函数 的 确切 拼写 ,使 用 air () 无 须 中 断 当 前 编码 流程 就 能 查看 相关 信息 。 

在 复杂 的 模块 或 类 这 样 的 对 象 上 调用 air () 时 ,有 时 可 能 会 产生 宛 长 且 难 以 快速 阅读 的 输出 
内 容 。 可 以 用 下 面 这 个 小 技巧 过 滤 出 感 兴趣 的 属性 列表 : 














SS | Seer” “i ol te me osloee ba oem 
['date', 'datetime', 'datetime_CAPI'] 


这 里 使 用 列表 解析 式 来 过 滤 air (aatetime) 调 用 的 结果 ， 仅 显示 包含 单词 date 的 名 称 。 注 
， 我 在 每 个 名 称 上 都 调用 了 lower () 方 法 ， 以 确保 过 滤 时 不 区 分 大 小 写 。 
仅 列 出 对 象 的 属性 有 时 并 不 足以 解决 手头 的 问题 。 那 么 关于 datetime 模块 导出 的 函数 和 
类 ， 怎 样 才能 获得 更 多 、 更 详细 的 信息 呢 ? 
可 以 使 用 Python 内 置 的 help () 函数 ， 以 在 Python 的 交互 式 帮助 系统 中 浏览 所 有 Python 对 
象 自 动 生成 的 文档 : 


>>> help (datetime) 





池 








如 果 在 Python 解释 器 会 话 中 运行 上 述 示例 ， 那 么 终端 将 显示 基于 文本 的 帮助 页 面 ， 其 中 有 
datetime 模块 的 相关 信息 ， 如 下 所 示 : 


Help on module datetime: 





NAME 
datetime - East implementation of the datetime type. 


CLASSES 
lo le 
date 
datetime 
time 





使 用 光标 上 下 键 能 滚动 文档 。 按 空格 键 会 一 次 向 下 滚动 几 行 。 按 q 键 会 退出 交互 式 帮助 模式 ， 
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回 到 解释 器 会 话 中 。 很 不 错 的 功能 ， 对 吧 ? 


顺便 说 一 句 , 可 以 在 所 有 Python 对 象 上 调用 help () , 包括 其 他 内 置 函 数 和 自 定义 的 Python 
类 。Python 解释 需 会 根据 对 象 及 其 文档 字符 串 ( 如 果 有 的 话 ) 自动 生成 帮助 文档 。 下面 的 help() 
函数 使 用 方式 都 是 正确 的 : 

>>> help (datetime.date) 


>>> help(datetime.date.fromtimestamp) 
Me le 

















当然 ，dir () 和 help () 还 是 比 不 上 格式 良好 的 HTML 文档 、 搜 索引 擎 或 Stack Overflow。 
但 这 两 个 函数 可 用 来 在 不 离开 Python 解释 器 的 情况 下 快速 查找 相关 内 容 ， 同 时 还 可 以 脱 机 使 用 ， 
在 特定 情况 下 非常 有 用 








O 


关键 要 点 


口 使 用 内 置 的 aiz () 函数 可 以 在 Python 解释 器 会 话 中 交互 式 地 探索 模块 和 类 。 
口 内 置 的 help () 函数 可 用 来 直接 在 解释 器 中 浏览 文档 〈 按 q 键 退出 )。 

















8.2 用 virtualenv 隔离 项 目 依赖 关系 


Python 有 强大 的 打包 系统 ， 可 用 来 管理 程序 的 模块 依赖 关系 。 你 可 能 已 经 用 pip 打包 管理 
命令 安装 过 第 三 方 软件 包 。 

使 用 pip 安装 有 一 个 问题 ， 那 就 是 软件 包 默认 会 被 安装 到 全 局 Python 环境 中 。 

当然 , 这 样 安装 的 新 软件 包 能 在 系统 上 随意 使 用 。 但 如 果 正 在 处 理 多 个 项 目 ， 每 个 项 目 需要 
同一 个 软件 包 的 不 同 版 本 ， 那 么 很 快 就 会 导致 一 场 晋 梦 。 例 如 ， 一 个 项 目 需要 库 的 1.3 版 本 ， 而 
另 一 个 项 目 需 要 这 个 库 的 1.4 版 本 。 

在 全 局 安装 软件 包 时 ， 所 有 程序 只 能 使 用 同一 版 本 的 Python 软件 包 ， 因 此 会 遇 到 版 本 冲突 
问题 ， 就 像 电影 Highlander" 一 样 。 

还 可 能 更 糟 ， 不 同 的 程序 可 能 会 用 到 不 同 版 本 的 Python。 例 如 ， 有 些 程序 仍然 在 Python 2 
上 运行 ， 而 大 部 分 新 程序 都 是 在 Python 3 中 开发 的 ; 或 者 某 个 项 目 需 要 Python 3.3， 而 其 他 所 有 
项 目 都 在 Python 3.6 上 运行 。 


除 此 之 外 ， 全 局 安装 Python 软件 包 也 会 带 来 安全 风险 。 修 改 全 局 环境 通常 需要 用 超级 用 户 
( root/admin ) 权限 运行 pip install 命令 。 由 于 pip 在 安装 新 软件 包 时 是 从 互联 网 下 载 代 码 并 






























































@ 电影 Highlander 里 的 主人 公 属 于 “ 异 人 ”但 这 些 “ 异 人 ”必须 彼此 残杀 ， 争 夺 第 一 才能 活 下 来 。 一 一 译 者 注 
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执行 ， 因此 通常 不 建议 用 超级 用 户 执 行 。 虽然 大 家 都 希望 代码 是 值得 信赖 的 , 但 是 谁 知 道 它 会 真 
正 做 些 什 么 ? 








8.2.1 使 用 虚拟 环境 


解决 这 些 问题 的 办 法 是 使 用 所 谓 的 虚拟 环境 将 各 个 Python 环境 分 开 ， 即 按 项 目 隔 离 Python 
依赖 ， 每 个 项 目 能 选择 不 同 版 本 的 Python 解释 器 。 

虚拟 环境 是 一 个 隔离 的 Python 环境 。 从 物理 上 来 说 ， 虚 拟 环境 位 于 一 个 文件 夹 中 ， 其 中 含 
有 所 需 的 软件 包 和 依赖 ， 比 如 Python 项目 需要 用 到 的 本 地 代码 库 和 解释 器 运行 时 。( 实际 上 可 能 
没有 完全 复制 这 些 文件 ， 只 是 使 用 了 占用 硬盘 空间 较 少 的 符号 链接 。) 

为 了 演示 虚拟 环境 的 工作 方式 , 下 面 快 速 走 一 遍 流程 来 设置 一 个 新 的 环境 ( 简称 为 virtualenv )， 
在 其 中 安装 第 三 方 软件 包 。 

首先 来 查看 全 局 Python 环境 所 在 的 位 置 。 在 Linux 或 macOS 上 , 使 用 which 命令 行 工具 查 
找 pip 程序 包 管理 器 的 路 径 : 


ne 
SS 










































































我 通常 将 虚拟 环境 直接 放 和 人 项目 文件 夹 中 , 以 便 更 好 地 组 织 项 目 和 分 离 环境 。 你 可 以 自行 决 
， 比 如 在 专门 的 python-environments 目录 下 保存 所 有 项 目的 环境 。 


下 面 来 创建 一 个 新 的 Python 虚拟 环境 : 


SG 


执行 这 条 命令 会 花 一 点 时 间 ， 然 后 在 当前 目录 中 创建 一 个 新 的 venv 文件 夹 ， 其 中 含有 基本 
的 Python 3 环境 : 





ay 


S18 wen 
|e include ls pyvenv.cfg 


如 果 使 用 which 命令 检查 当前 的 pip 版 本 ,会 发 现 仍 然 指 向 全 局 环境 ， 在 这 里 是 /usr/local/ 
bin/pip3: 























ele TO 
7 oe lox ele nl oe 

















这 意味 着 如 果 现 在 安装 软件 包 ， 仍 然 是 安装 到 全 局 Python 环境 中 。 因 此 创建 一 个 虚拟 环境 
文件 夹 还 不 够 ， 用 户 需要 显 式 激活 新 的 虚拟 环境 ， 这 样 才 会 运行 其 中 的 pip 命令 : 


$ source ./venv/bin/activate 
(venv) $8 
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运行 activate 命令 将 会 让 当前 的 shell 会 话 使 用 虚拟 环境 中 的 Python 和 pip 命令 。™ 
注意 ， 这 会 改变 shell 提示 符 ， 将 激活 的 虚拟 环境 的 名 称 包含 在 圆 括号 中 : (venv) 。 现 在 再 
来 看 看 当前 使 用 的 是 哪个 pip 可 执行 文件 : 


(venv) $ which pip3 /Users/dan/my- 
project/venv/bin/pip3 


从 中 可 以 看 到 ， 运行 pip3 命令 不 再 执行 全 局 环境 中 的 程序 ， 而 是 执行 虚拟 环境 中 的 pip。 
Python 解释 器 可 执行 文件 也 是 如 此 , 现在 从 命令 行 运行 python 也 会 从 venv 文件 夹 加 载 解释 器 : 









































(venv) $ which python /Users/dan/my- 
project/venv/bin/python 








注意 ， 现 在 仍然 是 一 个 空白 且 完 全 干净 的 Python 环境 。 运行 pip 1ist 显示 的 已 安装 软件 
包 列 表 只 有 密 密 几 项 ， 仪 包含 pip 本 身 所 需 的 基本 模块 : 
ET eS 


To (OO 
Setuptooles (0..8.0) 


现在 继续 在 虚拟 环境 中 安装 一 个 Python 软件 包 ， 此 时 需要 用 到 熟悉 的 pip install 命令 : 


(venv) $ pip install schedule 
Collecting schedule 

Downloading schedule-0.4.2-py2.py3-none-any .whl 
Installing collected packages: schedule 
Successfully installed schedule-0.4.2 


注意 到 这 里 有 两 个 重要 的 变化 : 首先 ， 运 行 pip 命令 不 再 需要 管理 员 权 限 ; 其 次 ， 在 当前 
虚拟 环境 中 安装 或 更 新 软件 包 意味 着 这 些 文件 最 终 都 位 于 虚拟 环境 目录 的 子 文件 夹 中 。 


因此 ， 这 个 项 目的 依赖 关系 与 系统 上 其 他 所 有 Python 环境 ( 包括 全 局 的 Python ) 在 物理 上 
都 是 分 离 的 。 实 际 上 现在 获得 了 专门 用 于 这 个 项 目的 Python 运行 时 副本 。 


再 次 运行 bip 1ist， 会 看 到 schedule 库 已 成 功 安 装 到 新 环境 中 : 

















(ET 
oa (GeO 
schedule {0.4.2) 
SeCupEeoole (28.8.0) 


只 要 这 个 环境 在 当前 shell 会 话 中 一 直 处 于 激活 状态 ,那么 使 用 python 命令 或 执行 独立 的 .py 
文件 ， 都 会 使 用 虚拟 环境 中 安装 的 Python 解释 器 和 依赖 项 。 


但 如 何 停止 或 “离开 ”虚拟 环境 呢 ? 与 activate 命令 类 似 ， 还 有 一 个 aeactivate 命令 























@ 在 Windows 上 直接 运行 activate 命令 ， 不 用 加 前 绥 。 














可 以 回 到 全 局 环境 : 


(venv) $ deactivate 

Sr de 

ene ee ou 

使 用 虚拟 环境 既 有 助 于 保持 系统 整洁 ， 又 能 理 清 Python 依赖 关系 。 虚 拟 环境 是 一 种 最 佳 实 
践 ， 所 有 Python 项 目 都 应 该 使 用 它 来 分 离 各 自 的 依赖 关系 和 避免 版 本 冲突 。 


理解 和 使 用 虚拟 环境 之 后 ,就 能 进一步 使 用 更 高 级 的 依赖 关系 管理 方法 ,如 用 requirements.txt 
文件 指定 项 目 依赖 关系 。 


如 果 想 深入 探讨 这 个 主题 ,了 解 更 多 的 高 效 技巧 , 那么 请 务必 查看 dbaderorg 上 的 “管理 Python 
依赖 关系 ”( Managing Python Dependencies ) 课程 。 


























8.2.2 ”关键 要 点 











口 虚拟 环境 用 来 隔离 项 目 依赖 ， 既 能 帮助 避免 软件 包 的 版 本 冲突 ， 又 能 使 用 不 同 版 本 的 
Python 运行 时 。 

口 虚拟 环境 是 一 种 最 佳 实践 ， 所 有 Python 项 目 都 应 使 用 它 来 存储 依赖 关系 。 这 样 能 免 去 很 
多 及 烦 。 


8.3 ”一 规 字 节 码 的 究竟 


CPython 解释 器 执行 程序 时 ,首先 将 其 翻译 成 一 系列 的 字 节 码 指 令 。 字 节 码 是 Python 虚拟 机 
的 中 间 语 言 ， 可 以 提高 程序 的 执行 效率 。 

CPython 解释 器 不 直接 执行 人 类 可 读 的 源码 ， 而 是 执行 由 编译 器 解析 和 语法 语义 分 析 产 生 的 
紧凑 的 数 、 常 量 和 引用 。 

这 样 ， 再 次 执行 相同 程序 时 能 节省 时 间 和 内 存 。 因 为 编译 步 又 产生 的 字 节 码 会 以 pyc 和 .pyo 
文件 的 形式 缓存 在 磁盘 上 ， 所 以 执行 字 节 码 比 再 次 解析 并 执行 相同 的 Python 文件 速度 更 快 。 

对 程序 员 来 说 所 有 这 些 步 又 都 是 完全 透明 的 ， 无 须 在 意 这 些 中 间 转 换 步 又 ， 也 无 须 在 意 
Python 虚拟 机 如 何 处 理 字 节 码 。 实 际 上 ， 字 节 码 格式 是 实现 细节 ， 在 各 Python 版 本 之 间 并 不 一 
定 保持 稳定 或 兼容 。 

舌 探 CPython 解释 器 内 部 并 了 解 其 工作 原理 能 够 提升 自己 、 获 得 启发 。 了 解 这 些 知 识 不 仅 能 
带 来 乐趣 ， 更 重要 的 是 有 助 于 编写 更 高 效 的 代码 。 

以 下 面 简 单 的 greet () 函数 作为 实验 样本 ， 从 中 学 习 Python 字 节 码 : 
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def greet (name): 
return 'Hello, ' + name + '!! 


>>> greet ('Guido') 
ET 








前 面 说 过 ，CPython 在 运行 这 段 代 码 之 前 首先 将 其 转换 为 中 间 语 言 。 如 果 这 种 说 法 是 真 的 ， 
那么 应 该 能 够 看 到 这 个 编译 步骤 的 结果 。 我 们 也 确实 可 以 看 到 。 
在 Python 3 中 , 每 个 函数 都 有 code “属性 ,这 个 属性 可 以 获取 greet 函数 用 到 的 虚拟 机 


指令 、 常 量 和 变量 : 

















>>> greet._ code .co_code 
Ilocos Oa O00 O00 O00 


>>> greet._ code .co_consts 
(NOmeDe Hoe 

>>> greet. code .co_varnames 
('name',) 


可 以 看 到 ，co_consts 中 含有 greet 函数 中 用 来 组 装 问候 语 的 字符 串 。 同 时 常量 和 代码 分 
开 存 储 以 节省 存储 空间 。 常 量 是 恒定 的 ， 永 远 不 会 改变 ， 可 以 在 多 个 地 方 互 换 使 用 。 


因此 ,Python 没有 在 co_code 指令 流 中 重复 存储 实际 的 常量 值 ， 而 是 将 Python 中 的 常量 
独 存储 在 查找 表 中 。 之 后 指令 流 使 用 查找 表 中 的 索引 来 引用 常量 ,存储 在 co_varnames 字段 中 
的 变量 也 是 如 此 。 


我 希望 这 个 总 体 思 想 已 经 逐步 明朗 了 , 但 看 着 co_coge 中 复杂 的 指令 流 , 似乎 有 点 不 现实 。 
这 种 中 间 语 言 显然 更 适合 CPython 虚拟 机 使 用 ， 基 于 文本 的 源码 才 是 供 人 类 阅读 的 。 

CPython 的 开发 人 员 也 意识 到 了 这 一 点 ， 所 以 提供 了 另 一 个 称 为 反 汇 编 器 的 工具 ， 以 便 更 容 
易 地 查看 字 节 码 。 


CPython 的 字 节 码 反 汇编 程序 位 于 标准 库 的 ais 模块 中 。 将 其 导入 并 在 greet 函数 中 调用 
qis.dis() 就 能 以 稍微 易于 阅读 的 形式 显示 对 应 的 字 节 码 : 


















































mone os 
>>> dis.disl(greet) 


2 0 LOAD_CONST Ta LO 
2 LOAD_FAST 0 (name) 
4 BINARY_ADD 
6 LOAD_CONST DER 
8 BINARY_ADD 
10 RETURN_VALUE 


反 汇 编 的 主要 工作 是 划分 指令 流 ， 并 为 其 中 的 每 个 操作 码 ( opcode ) 赋予 一 个 人 类 可 读 的 名 


称 ， 如 LOAD_CONST。 


从 中 还 可 以 看 到 常量 和 变量 引用 与 字 节 码 隔 开 了 一 段 距离 ， 其 中 的 值 也 完整 地 打印 了 出 来 ， 











省 得 我 们 根据 索引 在 co_const 或 co_varnames 表 中 手动 查看 ， 很 不 错 吧 ! 


通过 这 些 人 类 可 读 的 操作 码 ， 现 在 可 以 开始 理解 CPython 如 何 表示 和 执行 原 greet () 函数 
中 的 'Hello'， + name +'!1'! 表 达 式 了 。 








解释 器 首先 在 索引 1 处 ('Hello,' ) 查找 常量 并 将 其 放 在 栈 上 ， 然 后 将 name 变量 的 内 容 
放 在 栈 上 。 

这 个 栈 数据 结构 用 作 虚 拟 机 的 内 部 存储 空间 。 虚 拟 机 有 不 同 的 种 类 , 其 中 有 一 种 称 为 栈 式 虚 
拟 机 ，CPython 虚拟 机 就 是 这 种 实现 。 既 然 以 栈 命 名 这 种 虚拟 机 ， 那 么 就 不 难看 出 这 个 数据 结构 
在 其 中 的 重要 性 。 

顺便 说 一 句 ， 这 里 只 是 介绍 了 一 些 皮毛 。 如 果 你 对 这 个 主题 有 兴趣 ， 可 以 看 看 本 节 最 后 推荐 
的 一 本 书 。 钻 研 虚 拟 机 理论 不 仅 能 带 来 很 多 收获 ， 也 能 囊 来 很 多 乐趣 。 

栈 作为 抽象 数据 结构 ， 其 有 趣 之 处 在 于 只 支持 两 种 操作 : 入 栈 和 出 栈 。 入 栈 将 一 个 值 添加 
到 栈 项 ， 出 栈 删 除 并 返回 栈 项 的 值 。 与 数组 不 同 ， 栈 无 法 访问 栈 项 下 面 的 元 素 。 

栈 令 人 着 迷 ， 这 么 简单 的 数据 结构 却 有 着 非常 多 的 用 途 。 不 过 这 次 我 不 会 跑题 了 …… 

假设 栈 初始 为 空 ， 在 执行 前 两 个 操作 码 之 后 ， 虚 拟 机 栈 的 内 容 (0 是 最 上 面 的 元 素 ) 如 下 
所 示 : 


0 enmeo Neneents om name) 
te 
























































BINARY_ADD 指令 从 栈 中 弹出 两 个 字符 串 值 ， 并 将 它们 连接 起 来 ， 然 后 再 次 将 结果 压 人 栈 : 


0 "elke Cre 








然后 由 男 一 个 LOAD_CONST 将 感叹 号 字符 串 压 人 栈 : 


加 有 
Me ey 





下 一 个 BINARY_ADD 操作 码 再 次 将 这 两 个 字符 串 连 接 起 来 以 生成 最 终 的 问候 语 字 符 串 : 


0 errLem eurde 





最 后 的 字 节 码 指令 是 RETURN_VALUE, 它 告诉 虚拟 机 当前 位 于 栈 顶 的 是 该 函数 的 返回 值 , 可 
以 传递 给 调用 者 。 
瞧 ， 我 们 刚刚 跟踪 了 greet () 函数 在 CPython 虚拟 机 内 部 的 执行 过 程 ， 很 棒 吧 ? 


关于 虚拟 机 还 有 许多 内 容 , 但 这 不 是 本 书 的 主题 。 如 果 你 对 这 个 迷人 的 主题 感 兴趣 ,我 强烈 
建议 阅读 更 多 相关 内 容 。 
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定义 自己 的 字 节 码 语言 并 尝试 为 之 构建 虚拟 机 会 很 有 乐趣 。 关 于 虚拟 机 主题 的 书 我 推荐 
Wilhelm 和 Seidl 所 著 的 《编译 器 设计 : 虚拟 机 》( Compiler Design: Virtual Machines )。 























关键 要 点 


口 CPython 首先 将 程序 转换 为 中 间 字 节 码 ， 然 后 在 基于 栈 的 虚拟 机 上 运行 字 节 码 来 执行 程序 。 
口 使 用 内 置 的 ais 模块 可 深入 了 解 并 查看 字 节 码 。 
口 虚拟 机 值得 仔细 研究 。 




















十 人 
结 后 











恭喜 你 一 直 坚 持 到 了 最 后 ! 现在 是 时 候 表扬 一 下 自己 了 , 因为 大 多 数 人 买 回 一 本 书后 就 从 来 
没有 翻 开 过 ， 或 者 只 是 读 了 读 第 1 章 。 


然而 读 完 本 书后 , 真正 的 工作 才刚 刚 开始 。 看 和 做 之 间 的 区 别 很 大 ,你 要 将 从 本 书 中 学 到 的 
技能 和 技巧 运用 到 实际 中 ,不 要 让 它 停 留 在 书本 上 。 


你 可 以 尝试 开始 向 代码 中 加 入 一 些 Python 的 高 级 功能 ， 比 如 这 里 添加 一 个 清晰 简洁 的 生成 
器 表达 式 ， 那 里 添加 一 个 优雅 的 with 语句 …… 


如 果 你 能 正确 使 用 这 些 功能 , 那么 很 快 就 会 引起 同行 的 注意 。 只 要 经 过 一 些 练习 就 可 以 合理 
地 应 用 这 些 高 级 Python 功能 ， 从 而 让 代码 更 具 表 现 力 。 


相信 我 ,你 的 同事 们 在 一 段 时 间 后 也 会 使 用 这 些 功 能 。 如 果 他 们 向 你 请 教 , 请 慷慨 地 帮助 他 
们 。 比 如 可 以 召集 周围 的 人 ,向 他 们 介绍 从 本 书 中 学 到 的 知识 ,甚至 可 以 为 同事 们 举办 几 期 分 享 
会 来 介绍 如 何 “ 编 写 干净 的 Python”。 本 书 中 的 示例 可 以 随意 使 用 。 


作为 Python 开发 者 ， 出 色 地 完成 工作 和 被 他 人 看 到 出 色 地 完成 工作 是 有 区 别 的 。 因 此 不 要 
怕 露 头 ， 如 果 将 自己 的 技能 和 新 发 现 的 知识 与 众人 分 享 ， 你 的 职业 身 涯 也 会 受益 菲 浅 。 


我 在 自己 的 职业 生涯 和 项 目 中 也 遵循 同样 的 思维 方式 ， 所 以 一 直 在 寻找 改进 本 书 和 其 他 
Python 培训 资料 的 方法 。 无 论 你 想 指 出 书 中 的 错误 ， 还 是 有 问题 想 问 ,抑或 想 提 供 一 些 建设 性 的 
反馈 意见 ， 都 可 以 给 我 发 电子 邮件 : mail@dbaderorg。 


视 你 在 学 习 和 使 用 Python 时 能 感到 快乐 ! 
附 : 读者 可 以 访问 我 的 网 站 ， 并 在 dbader.org 和 我 的 YouTube 频道 上 继续 Python 之 旅 。 


9.1 针对 Python 开发 者 免费 每 周 提 示 


你 是 否 在 寻找 每 周 更 新 一 次 的 Python 开发 技巧 ， 以 提高 工作 效率 并 简化 工作 流程 ?” 好 消息 
是 ， 我 为 像 你 这 样 的 Python 开发 人 员 提供 了 一 个 免费 的 电子 邮件 订阅 服务 。 
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我 发 送 的 电子 邮件 订阅 并 不 是 常见 的 “这 里 有 当前 的 热门 文章 列表 ”形式 。 相 反 , 我 的 目标 
是 每 周至 少 以 一 篇 ( 短篇 ) 随笔 的 形式 分 享 一 个 原创 思想 。 


如 果 想 了 解 这 些 内 容 ， 请 访问 dbader.org/newsletter 并 在 注册 表单 中 输入 你 的 电子 邮件 地 址 。 
我 期 待 着 与 你 交流 ! 




















9.2 PythonistaCafe: Python 开发 人 员 的 社区 


掌握 Python 不 单单 要 通过 书籍 和 课程 来 学 习 。 要 获得 成 功 ， 还 需要 一 种 能 长 期 保持 动力 并 
提高 自身 能 力 的 方式 。 


很 多 Python 高 手 正在 为 此 而 苦 蔡 挣扎 ， 因 为 完全 自学 Python 很 枯燥 。 


如 果 你 是 一 位 自学 成 才 的 开发 人 员 ， 但 没有 从 事 技 术 相 关 的 日 常 工作 ， 那 么 很 难 独自 提升 。 
是 因为 周围 的 圈子 中 没有 开发 人 员 ， 也 没有 人 性 励 或 支持 你 努力 进步 。 


也 许 你 已 经 是 一 名 开发 人 员 了 , 但 公司 的 其 他 人 并 不 像 你 这 样 热爱 Python。 由 于 无 法 与 其 他 
人 分 享 自己 的 学 习 进 度 ， 在 停滞 不 前 时 也 无 法 得 到 建议 ， 这 会 令 人 非常 诅 丧 。 


从 我 的 个 人 经 验 来 看 , 现 有 的 在 线 社 区 和 社会 媒体 在 鼓励 支持 方面 做 得 也 不 怎么 好 。 下 面 列 
出 一 些 做 得 比较 好 的 站 点 ， 但 其 各 自 仍然 有 很 多 不 足 之 处 。 


口 Stack Overflow 用 于 针对 特定 主题 提出 一 次 性 (one-off ) 问题 ,在 平台 上 很 难 与 其 他 评论 
者 建立 人 际 关系 。 一 切 都 围绕 着 问题 本 身 ， 和 人 的 交流 不 多 。 例 如 ， 版 主 能 自由 编辑 其 
他 人 的 问题 、 答 案 和 评论 。Stack Overflow 感觉 更 像 是 一 个 维基 网 站 而 非 论 坛 。 

口 Twitter 就 像 是 用 来 闲谈 的 地 方 , 非常 适合 “闲逛 "， 但 每 次 只 能 发 送 几 个 句子 ,不 利于 讨 
论 实质 性 内 容 。 另 外 ， 如 果 不 经 常 在 线 就 会 错过 大 部 分 对 话 ， 而 如 果 经 常 在 线 则 会 因 无 
休止 的 打扰 和 通知 而 影响 工作 效率 。Slack 讨论 组 同样 如 此 。 

口 Hacker News 用 于 讨论 和 评论 技术 新 闻 ， 但 评论 者 之 间 不 会 建立 长 期 关系 。Hacker News 

也 是 当下 最 “好 斗 ” 的 技术 社区 之 一 ， 会 之 无 节制 和 底线 地 攻击 别人 。 

口 Reddit 覆盖 面 更 广 ,并 鼓励 人 与 人 之 间 的 讨论 , 比 Stack Overflow 的 一 次 性 问答 形式 要 好 。 
不 过 Reddit 是 一 个 拥有 数 百 万 用 户 的 巨大 公共 论坛 ， 有 许多 相关 问题 ， 如 不 当 行 为 、 做 
慢 、 齐 器 、 嫉 妨 …… 总 之 ， 睹 括 了 人 们 “最 好 ”的 那 部 分 行为 。 


最 终 我 意识 到 ， 开 发 人 员 难 以 前 进 的 原因 是 没有 合适 的 全 球 化 Python 开发 社区 。 因 此 我 创 
立 了 PythonistaCafe， 这 是 Python 开发 人 员 的 点 对 点 学 习 社 区 。 
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你 可 以 把 PythonistaCafe 看 作 Python 爱好 者 共同 进步 的 俱乐部 。 


在 PythonistaCafe 中 ， 你 能 够 与 来 自 世 界 各 地 的 专业 开发 人 员 和 爱好 者 交流 ， 在 安全 的 环境 
中 分 享 经 验 。 这 样 就 可 以 向 他 们 学 习 ， 避 免 犯 同样 的 错误 。 


你 能 够 在 PythonistaCafe 中 以 私密 的 方式 问 任何 问题 ,只 有 活跃 的 会 员 才 能 阅读 和 撰写 评论 。 
由 于 它 是 付费 社区 ， 其 中 几乎 不 存在 捣蛋 和 冒犯 的 行为 。 


由 于 PythonistaCafe 的 会 员 仅 限 邀请 加 入 ， 因 此 你 遇 到 的 人 都 积极 致力 于 提高 自己 的 Python 
技能 。 所 有 打算 加 入 的 成 员 都 需要 提交 申请 ， 这 样 能 确保 他 们 适合 该 社区 。 


你 会 加 入 一 个 真正 懂 你 的 社区 ,社区 也 了 解 你 正在 学 习 的 技能 和 职业 , 以 及 想 要 实现 的 目标 。 
如 果 你 想 提高 自己 的 Python 技能 ,但 还 没有 找到 合适 的 支持 环境 ， 那 么 试 试 PythonistaCafe 吧 。 


PythonistaCafe 建立 在 私人 论坛 平台 上 ， 用 户 可 以 提问 、 获 得 答案 、 分 享 自己 的 进度 。 我 们 
的 成 员 遍 布 世 界 各 地 ， 水 平 各 有 千秋 。 


读者 可 以 在 www.pythonistacafe.com 上 了 解 PythonistaCafe 和 社区 价值 观 等 更 多 内 容 。 








技术 改变 世界 阅读 塑造 人 生 





I 四 录 程 序 这 计 从 书 


流畅 的 Python 





SS 令 PSF 研 究 员 、 知 名 PyCon 演 讲 者 心血 之 作 ，Python 核 心 开发 人 员 担 


人 全 面 深入 ， 对 Python 语言 关键 特性 剖析 到 位 
， 令 大 量 详尽 代码 示例 ， 并 附 有 主题 相关 高 质量 参考 文献 
是 令 兼顾 Python 3 和 Python 2 
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令 以 机 器 学 习 算 法 实践 为 重点 ， 使 用 scikit-learn 库 从 头 构建 机 器 学 习 应 用 
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pa et 作者 : Andreas C. Muller，Sarah Guido 
译 者 : 张 亮 ( hysic ) 








Python 深度 学 习 


令 Keras 之 父 、Google 人 工 智 能 研究 员 Francois Chollet 执 笔 ， 深 度 学 
习 领 域 力作 

令 通俗 易 懂 ， 帮 助 读 者 建立 关于 机 器 学 习 和 深度 学 习 核心 思想 的 直觉 

令 16 开 全 彩印 刷 


作者 : 弗 朗 素 瓦 " 肖 莱 
Lf 六 全 下 由 村 译 者 : 张 亮 ( hysic ) 




















回复 “Python” 查 看 相关 书 单 


微 博 连 接 一 一 
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“ 达 恩 用 清晰 的 示例 解释 了 很 多 Python 重要 特性 ， 并 详 述 了 相关 实现 细节 。?” 
一 一 Bob Belderbos，Oracle 工 程 师 、PyBites 联 合 创始 人 


“我 不 是 Python 新 手 ， 也 熟悉 书 中 介绍 的 一 些 概念 ， 但 我 不 得 不 说 本 书 的 每 一 章 都 让 我 收益 良 多 。 
一 一 Og Maciel，Red Hat 工 程 师 


“我 花 了 好 几 年 才 充 分 理解 了 Python 这 门 语言 ， 所 以 看 到 达 恩 的 这 本 书 时 就 在 想 ， 要 是 我 当初 能 
这 样 的 参考 书 得 少 走 多 少 弯 路 啊 | ” 
一 一 Mariatta Wijaya，Python 核 心 开 发 人 员 


“本 书 不 是 简单 的 代码 片段 合集 ， 而 是 能 让 你 深入 理解 Python 的 内 在 原理 ， 并 欣赏 其 优美 之 处 。” 
一 一 Ben Felder，Python 高 手 


“本 书 就 像 一 位 经 验 丰 富 的 导师 从 旁 解释 各 种 小 技巧 一 样 …… 让 我 能 正确 、 合 理 地 使 用 这 些 常用 且 
县 有 Python 特 色 的 技巧 。” 





一 一 Daniel Meyer， 特 斯 拉 DA 


学 习 用 Python 断言 自动 检测 程序 错误 

合理 使 用 格式 化 和 去 号 维护 列表 、 字 典 和 集合 

深入 理解 Python 的 头等 对 象 一 一 函数 

使 用 _str_ 和 _repr_ 双 下 划 线 方法 自行 控制 类 中 的 字符 串 转 换 
namedtuple 如 何 更 好 地 组 织 数 据 结 构 
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